首页python爬虫获取src

python爬虫获取src

时间: 2023-08-23 18:11:08 浏览: 225

基于python的网页获取爬虫

一个相对标准的简单爬虫，根据用户输入获取网页源码并保存在本地。通过requests库获取到网页源码，decode解码，然后打开文件将解码后的文档以用户输入的保存文件名保存在与该爬虫相同目录下。

回答: 要获取src属性，你可以使用Python爬虫来实现。根据你提供的代码，可以看到你使用了requests库和lxml库来发送HTTP请求和解析HTML。如果你想获取图片的src属性，你可以使用xpath来定位img标签，并使用get方法获取src属性的值。以下是一个示例代码： ```python import requests from lxml import etree # 发送HTTP请求并获取网页源码 response = requests.get('http://xxxxxx.com/xxx?xxx', headers=headers) html = etree.HTML(response.content.decode()) # 使用xpath获取图片的src属性 img_src = html.xpath("//img/@src") # 打印获取到的src属性值 for src in img_src: print(src) ``` 如果你想获取其他类型的src属性，可以根据具体的HTML结构和标签来修改xpath表达式。希望这个示例能帮到你。 #### 引用[.reference_title] - *1* [Python爬虫爬取src图片](https://blog.csdn.net/weixin_54250368/article/details/122192440)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^koosearch_v1,239^v4^insert_chatgpt"}} ] [.reference_item] - *2* *3* [python 爬虫如何获取js里面的内容](https://blog.csdn.net/hanchaobiao/article/details/73150405)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^koosearch_v1,239^v4^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

阅读全文