使用python网络爬虫,访问豆瓣电影Top25(https://movie.douban.com/top250?start=0),获取每部电影的中文片名、排名、评分及其对应的链接,按照“排名-中文片名-评分-链接”的格式显示在屏幕上。
时间: 2024-05-15 22:16:53 浏览: 74
Python爬取豆瓣top250电影数据,并导入MySQL,写入excel
5星 · 资源好评率100%
以下是使用Python实现的代码:
```python
import requests
from bs4 import BeautifulSoup
url = 'https://movie.douban.com/top250?start=0'
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}
res = requests.get(url, headers=headers)
soup = BeautifulSoup(res.text, 'html.parser')
items = soup.select('.item')
for item in items:
rank = item.select('.pic em')[0].get_text()
title = item.select('.title')[0].get_text().strip()
rating = item.select('.rating_num')[0].get_text()
link = item.select('a')[0]['href']
print(rank + '-' + title + '-' + rating + '-' + link)
```
在这个程序中,我们首先使用requests库和BeautifulSoup库分别向目标网址发起请求,并使用css选择器来提取我们需要的信息。最后,我们使用print函数将结果输出到屏幕上。
阅读全文