实践项目采集黑马头条的评论列表代码
时间: 2024-12-24 21:00:56 浏览: 5
在Python中,如果你想要抓取黑马头条的评论列表,通常我们会使用网络爬虫技术,例如BeautifulSoup或Scrapy库配合requests库来获取网页内容。以下是一个简化的示例,展示如何使用`requests`和`BeautifulSoup`来获取页面上的评论:
```python
import requests
from bs4 import BeautifulSoup
def get_huomale_toutiao_comments(url):
# 发送HTTP请求获取HTML内容
response = requests.get(url)
# 检查请求是否成功
if response.status_code == 200:
# 使用BeautifulSoup解析HTML
soup = BeautifulSoup(response.text, 'html.parser')
# 找到评论区域或评论列表的元素(这取决于网站结构)
comments_container = soup.find('div', class_='comment-list') or soup.find('ul', id='comments')
# 提取每个评论的文本
comments = [comment.text for comment in comments_container.find_all('li', class_='comment-item')]
return comments
else:
print(f"Failed to fetch the page. Status code: {response.status_code}")
return []
# 调用函数并提供URL
url = "https://www.huomale.com/today/top" # 替换为你想抓取的黑马头条页面链接
comments = get_huomale_toutiao_comments(url)
# 打印评论列表
for i, comment in enumerate(comments, start=1):
print(f"评论 {i}: {comment}")
阅读全文