首页利用BeautifulSoup提取以下html中img标签后的数字1

利用BeautifulSoup提取以下html中img标签后的数字1

时间: 2024-03-13 18:43:18 浏览: 101

可以使用BeautifulSoup库中的find方法和正则表达式来提取HTML中的内容。例如，假设要提取以下HTML中img标签后的数字1： ```html <html> <body> <img src="image.png">1 </body> </html> ``` 可以使用以下代码： ```python from bs4 import BeautifulSoup import re html = """ <html> <body> <img src="image.png">1 </body> </html> """ soup = BeautifulSoup(html, "html.parser") # 使用正则表达式查找img标签后的数字 result = soup.find(text=re.compile(r"\d+")) print(result) ``` 在上面的代码中，首先将HTML字符串解析成BeautifulSoup对象，然后使用正则表达式查找img标签后的数字。`re.compile(r"\d+")`表示编译一个正则表达式，用于查找数字。`soup.find(text=re.compile(r"\d+"))`表示在BeautifulSoup对象中查找符合正则表达式的文本内容。最后输出结果为`1`。

阅读全文