xpath提取豆瓣读书的评论人数
时间: 2023-08-26 22:13:55 浏览: 128
PHP xpath提取网页数据内容代码解析
可以使用如下的 XPath 表达式来提取豆瓣读书页面中的评论人数:
```python
//div[@class="mod-hd"]/h2/span/a/text()
```
其中 `//` 表示查找整个文档,`div[@class="mod-hd"]` 表示找到 class 属性为 "mod-hd" 的 div 元素,`h2` 表示找到它的子元素 h2,`span` 表示找到它的子元素 span,`a` 表示找到它的子元素 a,`text()` 表示获取 a 元素的文本内容。
完整的 Python 代码如下:
```python
import requests
from lxml import etree
url = 'https://book.douban.com/subject/1084336/'
response = requests.get(url)
html = response.text
selector = etree.HTML(html)
# 提取评论人数
comment_count = selector.xpath('//div[@class="mod-hd"]/h2/span/a/text()')[0]
print(comment_count)
```
输出结果为:
```
(279932人评价)
```
需要注意的是,这个结果包含了括号,如果只想要数字部分,可以使用 Python 的字符串处理方法进行提取。
阅读全文