python代码实现爬取豆瓣电影250
时间: 2023-10-08 12:14:19 浏览: 99
python爬虫豆瓣电影Top250数据分析与可视化(应用Flask框架、Echarts、WordCloud等技术).zip
好的,我可以帮你回答这个问题。以下是实现爬取豆瓣电影250的Python代码:
```python
import requests
from bs4 import BeautifulSoup
url = 'https://movie.douban.com/top250'
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}
def get_movie_info(movie_list):
for movie in movie_list:
movie_name = movie.find('span', class_='title').get_text()
movie_rating = movie.find('span', class_='rating_num').get_text()
print(movie_name, movie_rating)
def get_movie_list(url):
res = requests.get(url, headers=headers)
soup = BeautifulSoup(res.text, 'html.parser')
movie_list = soup.find_all('div', class_='info')
return movie_list
if __name__ == '__main__':
for i in range(0, 250, 25):
url = f'https://movie.douban.com/top250?start={i}&filter='
movie_list = get_movie_list(url)
get_movie_info(movie_list)
```
这个代码使用requests库和BeautifulSoup库,发送网络请求获取网页源码,然后使用BeautifulSoup来解析源码,最后将豆瓣电影250的电影名称和评分输出到控制台。通过遍历不同的URL链接,我们可以获取豆瓣电影250的所有电影信息。
阅读全文