find.all() 我想获取照片中的src 的值
时间: 2024-10-18 15:14:57 浏览: 8
正则获取html中的 <img src = 图片地址
5星 · 资源好评率100%
`find_all()` 是 Python 中 `BeautifulSoup` 库的一个常用方法,用于从 HTML 或 XML 文档中查找匹配指定标签(或正则表达式)的所有元素。当你处理网页抓取时,可能会遇到包含大量图片链接(src属性)的情况。
如果你想从一个 HTML 结构中提取所有的 `<img>` 标签的 `src` 属性值,你可以这样做:
```python
from bs4 import BeautifulSoup
import requests
# 假设url是你要抓取的网页地址
url = 'http://example.com'
# 使用requests获取网页内容
response = requests.get(url)
html_content = response.text
# 使用BeautifulSoup解析HTML
soup = BeautifulSoup(html_content, 'html.parser')
# 查找所有<img>标签并提取src属性
images_src = soup.find_all('img', src=True)
# 现在images_src是一个列表,其中包含每个<img>标签的src属性值
for img in images_src:
print(img['src'])
```
这个例子中,`find_all('img', src=True)` 会找到所有 `img` 标签,并且只返回那些 `src` 属性存在的标签。如果有些 `img` 没有 `src`,它们将不会被包括在结果中。
阅读全文