python爬取猫眼电影代码
时间: 2023-08-29 18:11:17 浏览: 106
以下是使用 Python 爬取猫眼电影的代码:
```python
import requests
from lxml import etree
# 请求头部信息
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}
# 猫眼电影TOP100的URL地址
url = 'https://maoyan.com/board/4'
# 发送HTTP请求
response = requests.get(url, headers=headers)
# 解析HTML内容
html = etree.HTML(response.text)
# 获取电影名称和主演信息
movies = html.xpath('//div[@class="movie-item-info"]')
for movie in movies:
name = movie.xpath('./p[@class="name"]/a/text()')[0]
star = movie.xpath('./p[@class="star"]/text()')[0].strip()
print(name, star)
```
这段代码使用了 requests 和 lxml 库,通过发送 HTTP 请求获取猫眼电影TOP100的HTML页面,再使用 xpath 解析出电影名称和主演信息,最后输出到控制台。注意,为了避免请求被拒绝,我们添加了 User-Agent 头部信息。
阅读全文