网络爬虫初级实践(一)显示影片基本信息 访问豆瓣电影Top250(https://movie.douban.com/top250?start=0),获取每部电影的中文片名、排名、评分及其对应的链接,按照“排名-中文片名-评分-链接”的格式显示在屏幕上。
时间: 2024-10-01 16:06:32 浏览: 105
网络爬虫初级实践可以从访问豆瓣电影Top250页面开始。首先,你需要使用Python的requests库来发送HTTP请求并抓取网页内容,然后可以利用BeautifulSoup或lxml等HTML解析库来提取所需信息。以下是简化的步骤:
1. **安装必要的库**:
```
pip install requests beautifulsoup4
```
2. **编写Python脚本**:
```python
import requests
from bs4 import BeautifulSoup
url = "https://movie.douban.com/top250?start=0"
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
# 找到电影列表元素
movie_list = soup.find('ol', {'class': 'grid_view'})
for item in movie_list.find_all('li', {'class': 'item'}):
rank = item.find('span', {'class': 'rating_num'}).text
title = item.h3.a.text
rating = item.find('span', {'class': 'rating'}).find('span').text
link = "https://movie.douban.com" + item.h3.a['href']
print(f"{rank}- {title} - {rating} - {link}")
```
3. **运行脚本**:
运行这个脚本会打印出每个电影的基本信息。
注意:
阅读全文