python爬虫a href
时间: 2023-11-08 10:55:22 浏览: 129
在Python中,如果我们想要使用爬虫获取某个网页中所有a标签中的超链接网址,可以使用一些库和正则表达式来实现。首先,需要安装Python。然后,可以使用re库来调用正则表达式。在PyCharm中,可以输入以下代码来获取a href的链接:
```python
import re
# 假设data是一个包含a标签的列表
data = ["<a href='http://www.example.com'>Link 1</a>", "<a href='http://www.example2.com'>Link 2</a>"]
for item in data:
result = {"link": re.findall(r"href='(.*?)'", item)}
print(result)
```
运行这段代码后,就可以打印出所有a标签中的超链接网址。其中,`re.findall(r"href='(.*?)'", item)`这行代码使用了正则表达式来匹配a标签中的href属性值,并将匹配到的结果存储在result字典中的link键中。<span class="em">1</span><span class="em">2</span><span class="em">3</span>
#### 引用[.reference_title]
- *1* *2* [Python爬虫获取某个网页所有的a标签中的超链接网址](https://blog.csdn.net/hadues/article/details/88981686)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"]
- *3* [Python 爬虫入门的教程(2小时快速入门、简单易懂、快速上手)](https://blog.csdn.net/weixin_28760063/article/details/100166449)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"]
[ .reference_list ]
阅读全文