爬取1905电影网的数据代码
时间: 2024-09-23 13:15:19 浏览: 44
爬取网站数据通常涉及网络请求、HTML解析和数据提取等步骤,这里是一个简单的Python示例,使用`requests`库发送HTTP请求获取1905电影网的网页内容,然后使用BeautifulSoup库解析HTML来抓取数据。注意,实际操作时需要遵守网站的robots.txt协议,并尊重版权。
```python
import requests
from bs4 import BeautifulSoup
# 目标URL
url = 'https://www.1905.com/' # 请替换为你想要抓取的具体页面地址
# 发送GET请求
response = requests.get(url)
# 检查请求是否成功
if response.status_code == 200:
# 解析HTML内容
soup = BeautifulSoup(response.text, 'html.parser')
# 使用BeautifulSoup的方法找到目标数据,例如电影列表
movie_list = soup.select('.movie-list-item') # 根据网页结构修改选择器
for movie in movie_list:
title = movie.find('h3', class_='title').text # 提取标题
release_year = movie.find('span', class_='year').text # 提取年份
print(f"电影名称: {title}, 发布年份: {release_year}")
else:
print("请求失败")
阅读全文