访问豆瓣电影Top250(https://movie.douban.com/top250?start=0),获取每部电影的中文片名、排名、评分及其对应的链接,按照“排名-中文片名-评分-链接”的格式显示在屏幕上。python爬虫
时间: 2024-10-14 19:15:44 浏览: 160
要使用Python爬虫访问豆瓣电影Top250并获取所需信息,你可以使用第三方库如`requests`和`BeautifulSoup`。以下是一个基础的示例代码:
```python
import requests
from bs4 import BeautifulSoup
# 设置URL
url = "https://movie.douban.com/top250"
# 发送GET请求
response = requests.get(url)
# 检查请求状态码
if response.status_code == 200:
# 解析HTML内容
soup = BeautifulSoup(response.text, 'lxml')
# 找到包含电影信息的部分(通常在<ul id="link-report">)
movie_list = soup.select("#link-report li")
for i, movie in enumerate(movie_list, start=1):
# 获取电影元素中的信息
rank = f"{i}"
title = movie.find('span', {'class': 'title'}).text.strip()
rating = movie.find('span', {'itemprop': 'ratingValue'}).text
link = movie.find('a')['href']
print(f"{rank} - {title} - {rating} - <a href='{link}' target='_blank'>详情</a>")
else:
print("请求失败:", response.status_code)
```
请注意,这只是一个基本的示例,实际的网页结构可能会有所变化,所以你可能需要调整CSS选择器来准确提取信息。此外,爬虫应当遵守网站的robots.txt规则,并考虑使用代理以避免过于频繁的请求导致IP受限。
阅读全文
相关推荐
![pdf](https://img-home.csdnimg.cn/images/20241231044930.png)
![pdf](https://img-home.csdnimg.cn/images/20241231044930.png)
![zip](https://img-home.csdnimg.cn/images/20241231045053.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![pdf](https://img-home.csdnimg.cn/images/20241231044930.png)
![pptx](https://img-home.csdnimg.cn/images/20241231044947.png)