# 目标网站:www.hongniuziyuan.com # 爬取下来的数据格式 # 保存到记事本中 # 电影名字|导演|演员|评分|所属地区|播放地址 # 变形金刚|小斯蒂芬·卡普尔|安东尼·拉莫斯,多米尼克·菲什巴克,彼特·库伦,朗·普尔曼,彼特·丁拉|0.0|美国|https://hnzy.bfvvs.com/play/YervnY4e import requests from lxml import etree response = requests.get("https://www.hongniuziyuan.com/index.php/vod/detail/id/0BvCCS.html?ac=detail") html = response.content.decode() # 将二进制数据转换为文本数据 # response.text 文本数据 # print(html) # 将我们字符串转换为一个dom树 dom = etree.HTML(html) # 目的就是为了使用xpath语法去寻找我们的想要的标签 #元素:<span>Tales of Demons and Gods 5th Season</span> #xpath:/html/body/div[4]/div[1]/div/div/div[2]/div[2]/ul/li[1]/strong xs = dom.xpath('') for s in xs: movie_name = s.text.strip() print(movie_name)
时间: 2023-12-24 13:05:57 浏览: 39
很抱歉,我之前给出的代码示例有误。给出的XPath表达式没有完整地匹配到目标元素。以下是修正后的代码示例:
```python
import requests
from lxml import etree
response = requests.get("https://www.hongniuziyuan.com/index.php/vod/detail/id/0BvCCS.html?ac=detail")
html = response.content.decode()
# 将二进制数据转换为文本数据
# response.text 文本数据
# print(html)
# 将我们字符串转换为一个dom树
dom = etree.HTML(html)
# 目的就是为了使用xpath语法去寻找我们的想要的标签
# 元素:<span>Tales of Demons and Gods 5th Season</span>
# xpath:/html/body/div[4]/div[1]/div/div/div[2]/div[2]/ul/li[1]/strong/span
xs = dom.xpath('/html/body/div[4]/div[1]/div/div/div[2]/div[2]/ul/li[1]/strong/span')
for s in xs:
movie_name = s.text.strip()
print(movie_name)
```
请根据网页的结构和XPath语法进行适当的调整,以便正确提取电影信息。希望这次的回答能够帮助您!如果您还有其他问题,请随时提问。