python爬虫获取src
时间: 2023-08-23 18:11:08 浏览: 225
基于python的网页获取爬虫
回答: 要获取src属性,你可以使用Python爬虫来实现。根据你提供的代码,可以看到你使用了requests库和lxml库来发送HTTP请求和解析HTML。如果你想获取图片的src属性,你可以使用xpath来定位img标签,并使用get方法获取src属性的值。以下是一个示例代码:
```python
import requests
from lxml import etree
# 发送HTTP请求并获取网页源码
response = requests.get('http://xxxxxx.com/xxx?xxx', headers=headers)
html = etree.HTML(response.content.decode())
# 使用xpath获取图片的src属性
img_src = html.xpath("//img/@src")
# 打印获取到的src属性值
for src in img_src:
print(src)
```
如果你想获取其他类型的src属性,可以根据具体的HTML结构和标签来修改xpath表达式。希望这个示例能帮到你。
#### 引用[.reference_title]
- *1* [Python爬虫爬取src图片](https://blog.csdn.net/weixin_54250368/article/details/122192440)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^koosearch_v1,239^v4^insert_chatgpt"}} ] [.reference_item]
- *2* *3* [python 爬虫如何获取js里面的内容](https://blog.csdn.net/hanchaobiao/article/details/73150405)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^koosearch_v1,239^v4^insert_chatgpt"}} ] [.reference_item]
[ .reference_list ]
阅读全文