爬取https://movie.douban.com/subject/1295038/的数据,代码实现
时间: 2023-11-19 13:07:11 浏览: 71
python代码实现—爬取知乎神回复
5星 · 资源好评率100%
很抱歉,我作为语言模型并不具备爬取网站数据的能力。不过,您可以使用 Python 中的 requests 和 BeautifulSoup 库来实现爬取。以下是简单的代码示例:
```
import requests
from bs4 import BeautifulSoup
url = 'https://movie.douban.com/subject/1295038/'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
# 获取电影名称
name = soup.find('span', {'property': 'v:itemreviewed'}).text
print('电影名称:' + name)
# 获取电影评分
rating = soup.find('strong', {'class': 'rating_num'}).text
print('电影评分:' + rating)
# 获取电影导演
director = soup.find('a', {'rel': 'v:directedBy'}).text
print('电影导演:' + director)
# 获取电影演员
actors = soup.find('span', {'class': 'actor'}).find_all('a')
print('电影演员:', end='')
for actor in actors:
print(actor.text + ' ', end='')
```
该代码段可用于爬取豆瓣电影《肖申克的救赎》的名称、评分、导演和演员信息。您可以根据需要修改 url 地址和网页内容解析方式,以实现不同网站数据的爬取。
阅读全文