豆瓣电影前25名电影名字信息获取 豆瓣电影前25名电影名字信息获取 确定目标网页 url 地址:https://movie.douban.com/top250?format=text 要求: 输出 序号 电影名称(如图所示) 并将其按照格式保存到本地txt文档当中
时间: 2024-09-29 09:07:28 浏览: 38
豆瓣电影的前25名电影名称可以从指定URL抓取。首先,你需要使用网络爬虫技术,比如Python的BeautifulSoup库或者Scrapy框架来访问该页面,并解析HTML内容提取电影信息。以下是简化的步骤:
1. **安装依赖**:如果你还没有安装`requests`和`beautifulsoup4`,可以使用pip安装:
```
pip install requests beautifulsoup4
```
2. **编写Python脚本**:
```python
import requests
from bs4 import BeautifulSoup
# 目标URL
url = "https://movie.douban.com/top250?format=text"
# 发送GET请求
response = requests.get(url)
# 解析HTML
soup = BeautifulSoup(response.text, 'lxml')
# 找到包含电影名称的元素,通常是在表格里
table = soup.find('table', {'class': 'grid_view'})
rows = table.find_all('tr')[:25] # 获取前25行
# 提取数据
data = []
for row in rows:
cols = row.find_all('td')
if cols:
title = cols[1].find('a')['title'] # 电影名称通常在第2列
data.append((row.index(cols) + 1, title)) # 序号从1开始
# 将数据保存到txt文件
with open("top_25_movies.txt", "w", encoding="utf-8") as f:
for index, movie_title in data:
f.write(f"{index}. {movie_title}\n")
print("数据已保存至top_25_movies.txt")
```
3. **运行脚本**:运行上述代码,它将创建一个名为`top_25_movies.txt`的文本文件,其中包含按序号排列的前25部电影标题。
阅读全文