python xpath爬取新闻标题
时间: 2023-09-21 20:06:57 浏览: 459
基于Python的关键词爬取新闻
以下是一个简单的 Python 程序,用于使用 XPath 爬取新闻标题:
```python
import requests
from lxml import etree
url = 'https://news.baidu.com/'
response = requests.get(url)
html = response.text
tree = etree.HTML(html)
# 使用 XPath 获取新闻标题
titles = tree.xpath('//div[@class="hotnews"]/ul/li/a/text()')
# 输出新闻标题
for title in titles:
print(title)
```
该程序使用 requests 库发送 HTTP 请求,并使用 lxml 库解析响应文本。然后,它使用 XPath 表达式来选择新闻标题。在这个例子中,我们使用了一个简单的 XPath 表达式 `//div[@class="hotnews"]/ul/li/a/text()`,它会匹配新闻页面上的热门新闻中的所有标题。
最后,我们使用一个简单的 for 循环,输出新闻标题。
阅读全文