爬取猫眼电影网任一部电影的演员表和评论信息
时间: 2024-06-16 21:04:56 浏览: 178
爬取猫眼电影的排行榜前100名
3星 · 编辑精心推荐
要爬取猫眼电影网的电影演员表和评论信息,你可以使用Python中的爬虫库,例如BeautifulSoup和requests。以下是一个简单的示例代码,用于爬取电影《流浪地球》的演员表和评论信息:
```python
import requests
from bs4 import BeautifulSoup
# 请求电影详情页
url = 'https://maoyan.com/films/1218273'
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.182 Safari/537.36'
}
response = requests.get(url, headers=headers)
# 解析演员表
soup = BeautifulSoup(response.text, 'html.parser')
actors = soup.select('.celebrity-group .celebrity.actor .info a')
actor_list = [actor.text.strip() for actor in actors]
# 解析评论信息
comments = soup.select('.comment-content')
comment_list = [comment.text.strip() for comment in comments]
# 打印演员表和评论信息
print('演员表:')
for actor in actor_list:
print(actor)
print('\n评论信息:')
for comment in comment_list:
print(comment)
```
请注意,这只是一个简单的示例代码,实际爬取网页时可能需要处理更多的异常情况和反爬机制。另外,爬取网页信息需要遵守网站的使用规则,不要频繁请求或过度使用资源,以免对网站造成负担。
阅读全文