python爬取百度地图酒店评论
时间: 2023-08-19 09:04:33 浏览: 217
Booking网站爬虫-酒店评论(Python代码)
要爬取百度地图酒店评论,你需要模拟浏览器发起请求,获取酒店评论数据。以下是一个简单的Python爬虫代码,可以获取指定酒店的评论数据:
```python
import requests
import json
# 酒店ID
hotel_id = "xxxxxxxxxx"
# 评论页数
page_num = 1
# 每页评论数
page_size = 10
# 请求URL
url = "https://map.baidu.com/detail/ajax/vote?uid=" + hotel_id + "&page=" + str(page_num) + "&pageSize=" + str(page_size)
# 请求头
headers = {
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3"}
# 发起请求
response = requests.get(url=url, headers=headers)
# 获取评论数据
data = json.loads(response.text)
comments = data["result"]["comments"]
# 打印评论数据
for comment in comments:
print(comment["content"])
```
其中,你需要自己设置`hotel_id`、`page_num`和`page_size`参数。`hotel_id`是酒店ID,可以在百度地图上搜索酒店并获取ID。`page_num`和`page_size`分别为评论页数和每页评论数,可以根据需要自行设置。注意,每次请求返回的评论数最多为20条,如果需要获取更多评论,需要多次请求不同页数的数据。
阅读全文