利用BeautifulSoup提取以下html中img标签后的数字1
时间: 2024-03-13 18:43:18 浏览: 101
可以使用BeautifulSoup库中的find方法和正则表达式来提取HTML中的内容。
例如,假设要提取以下HTML中img标签后的数字1:
```html
<html>
<body>
<img src="image.png">1
</body>
</html>
```
可以使用以下代码:
```python
from bs4 import BeautifulSoup
import re
html = """
<html>
<body>
<img src="image.png">1
</body>
</html>
"""
soup = BeautifulSoup(html, "html.parser")
# 使用正则表达式查找img标签后的数字
result = soup.find(text=re.compile(r"\d+"))
print(result)
```
在上面的代码中,首先将HTML字符串解析成BeautifulSoup对象,然后使用正则表达式查找img标签后的数字。`re.compile(r"\d+")`表示编译一个正则表达式,用于查找数字。`soup.find(text=re.compile(r"\d+"))`表示在BeautifulSoup对象中查找符合正则表达式的文本内容。最后输出结果为`1`。
阅读全文