python爬取携程酒店评论代码
时间: 2024-07-17 12:00:51 浏览: 224
Python爬取携程酒店评论通常涉及网络请求、HTML解析以及可能的数据存储等步骤。这里是一个简单的示例,使用requests库发送GET请求获取网页内容,BeautifulSoup库解析HTML提取评论信息,但请注意实际操作时可能需要处理反爬虫机制和遵守网站的使用政策:
```python
import requests
from bs4 import BeautifulSoup
# 设置目标URL,例如:"https://hotel.ctrip.com/web/hotel/10000000/reviewlist?checkin=2023-05-01&checkout=2023-05-05"
url = "https://example.com" # 请替换为实际URL
def get_hotel_reviews(url):
headers = {'User-Agent': 'Mozilla/5.0'} # 需要模拟浏览器头
response = requests.get(url, headers=headers)
if response.status_code == 200:
soup = BeautifulSoup(response.text, 'lxml')
# 解析评论部分的HTML结构(根据携程的具体页面结构)
review_blocks = soup.find_all('div', class_='review_content') # 这里假设评论在class为'review_content'的元素中
for block in review_blocks:
user = block.find('span', class_='username').text.strip() # 用户名
comment = block.find('p', class_='comment_text').text.strip() # 评论内容
rating = block.find('i', class_='star').get('title') # 星级评分
print(f"{user} - {rating}: {comment}")
else:
print(f"Failed to fetch the page with status code {response.status_code}")
get_hotel_reviews(url)
```
阅读全文