Python爬取四川省的各旅游景点信息,特征有景点名称、星级、城市、票价、销量、热度6个维度
时间: 2023-06-27 13:07:33 浏览: 184
基于python的旅游信息爬取以及数据分析.doc
5星 · 资源好评率100%
你可以使用Python的爬虫库BeautifulSoup和requests来实现这个功能。首先,你需要找到一个包含四川省各旅游景点信息的网站,然后使用requests获取网页内容,再使用BeautifulSoup解析网页内容,提取出需要的信息。
以下是一个示例代码:
```python
import requests
from bs4 import BeautifulSoup
url = 'http://www.sichuan.gov.cn/lygk/zjly/sjly/index.html' # 以四川省旅游局官网为例
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
spots = soup.find_all('div', class_='list-item')
for spot in spots:
name = spot.find('h3').text.strip() # 景点名称
star = spot.find('span', class_='star').text.strip() # 星级
city = spot.find('span', class_='city').text.strip() # 城市
price = spot.find('span', class_='price').text.strip() # 票价
sales = spot.find('span', class_='sales').text.strip() # 销量
hot = spot.find('span', class_='hot').text.strip() # 热度
print(name, star, city, price, sales, hot)
```
这段代码会输出每个景点的名称、星级、城市、票价、销量、热度,你可以根据需要进行修改和调整。同时,需要注意网站的反爬机制,不要过度请求或请求速度过快。
阅读全文