首页爬虫爬取豆瓣肖申克救赎影评代码完整

爬虫爬取豆瓣肖申克救赎影评代码完整

时间: 2024-11-08 12:12:33 浏览: 15

使用Python编写一个简单的爬虫来抓取豆瓣电影《肖申克的救赎》的影评需要几个步骤，这里提供一个基础示例，我们假设使用requests和BeautifulSoup库来进行网络请求和HTML解析。请注意，实际的网页结构可能会有所变化，所以这只是一个大概的框架，可能需要根据实际情况调整。 ```python import requests from bs4 import BeautifulSoup # 目标URL，这里是一个示例，通常需要替换为你获取数据的实际URL url = "https://movie.douban.com/subject/1292052/" # 豆瓣电影详情页链接 def get_reviews(url): response = requests.get(url) soup = BeautifulSoup(response.text, 'lxml') # 查找评论区域的HTML标签，这可能因网站更新而改变 reviews_container = soup.find('div', {'class': 'comment-thread'}) if reviews_container is not None: for review in reviews_container.find_all('span', {'class': 'short'}): # 这里假设每个评论都在一个'span'元素中 title = review.find('a').text # 用户名 content = review.text.strip() # 评论内容 print(f"用户名：{title}\n评论内容：{content}\n--") else: print("未找到评论区或评论已关闭") get_reviews(url) ```

阅读全文