python爬取影视
时间: 2023-10-02 13:09:29 浏览: 36
要使用Python爬取影视信息,可以使用requests库发送HTTP请求获取数据,并使用csv库将数据保存为CSV文件。
以下是一个示例代码:
```python
import csv
import requests
url = 'https://movie.douban.com/j/chart/top_list'
start = input('从库中第几部电影取:')
limit = input('取几部:')
param = {
'type': '24',
'interval_id': '100:90',
'action': '',
'start': start,
'limit': limit
}
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/98.0.4758.102 Safari/537.36 Edg/98.0.1108.62'
}
response = requests.get(url=url, params=param, headers=headers)
list_data = response.json()
f = open('./豆瓣.csv', 'w', encoding='utf-8-sig', newline='')
csv_write = csv.DictWriter(f, fieldnames=['电影名', '主演人数', '主演', '评分', '上映时间', '类型', '评论数', '拍摄国家'])
csv_write.writeheader()
for i in list_data:
dic = {
'电影名': i['title'],
'主演人数': i['actor_count'],
'主演': i['actors'],
'评分': i['score'],
'上映时间': i['release_date'],
'类型': i['types'],
'评论数': i['vote_count'],
'拍摄国家': i['regions']
}
csv_write.writerow(dic)
f.close()
```
这段代码使用了requests库发送GET请求获取豆瓣电影的排行榜信息,并将返回的JSON数据解析后保存为CSV文件。你可以自定义从哪一部电影开始取,以及取多少部电影。最终的CSV文件将包含电影名、主演人数、主演、评分、上映时间、类型、评论数和拍摄国家等信息。
注意,代码中的`./豆瓣.csv`表示将CSV文件保存在当前工作目录下的"豆瓣.csv"文件中。你可以根据需要修改保存路径和文件名。