使用【pycharm】写【豆瓣电影top250中电影名称、评分、评价人数、评语内容的匹配获取】的代码
时间: 2024-09-19 10:08:05 浏览: 40
在PyCharm中编写Python代码来从豆瓣电影Top250列表中获取电影名称、评分、评价人数以及部分评语,你可以使用`requests`库来发送HTTP请求,然后解析返回的数据通常会用到`BeautifulSoup`库。下面是一个简单的示例:
```python
import requests
from bs4 import BeautifulSoup
# 豆瓣电影API地址
url = "https://movie.douban.com/top250"
def get_movie_info():
# 发送GET请求
response = requests.get(url)
# 检查请求是否成功
if response.status_code == 200:
soup = BeautifulSoup(response.text, 'lxml')
# 找到电影信息容器,这里假设每个电影在HTML中有id为"interest_sectl"
movie_containers = soup.find_all('div', id='interest_sectl')
for container in movie_containers:
title = container.h3.a['title'] # 电影名称
rating = float(container.rating.score) # 评分
review_count = int(container.rating totalCount) # 评论人数
# 获取部分评语,一般评语都在相邻的span标签内,这里仅取第一条
comment = container.p.text.strip()[:100] # 评语内容(截断长度)
print(f"电影名: {title}\n评分: {rating}\n评价人数: {review_count}\n评语: {comment}\n")
else:
print("请求失败")
get_movie_info()
```
注意,这个例子假设了豆瓣电影Top250页面的HTML结构保持不变。实际的网页结构可能会有变化,你需要根据当前的实际HTML结构调整CSS选择器。此外,豆瓣可能有反爬虫机制,频繁请求可能会导致IP受限,所以在实际应用中记得添加适当的延迟或使用代理。