用python爬虫收集热门旅游景点的数据的代码
时间: 2024-10-21 16:15:10 浏览: 28
在Python中编写爬虫来收集热门旅游景点的数据通常涉及到网络请求、HTML解析以及数据存储等步骤。这里是一个基本的示例,我们将使用`requests`库获取网页内容,然后用`BeautifulSoup`库解析HTML并提取所需信息。假设我们目标是爬取某个网站的“热门景点”列表。
```python
import requests
from bs4 import BeautifulSoup
# 目标URL,替换为你需要爬取的景点页面链接
url = 'https://example.com/hot-tourist-spots'
# 发送GET请求
response = requests.get(url)
# 检查请求是否成功
if response.status_code == 200:
# 解析HTML内容
soup = BeautifulSoup(response.text, 'html.parser')
# 找到包含景点信息的部分(这取决于实际网页结构)
attractions = soup.find_all('div', class_='hot-attraction')
# 提取景点名称和简介(同样需要根据实际HTML结构调整)
data = []
for attraction in attractions:
name = attraction.find('h2').text
description = attraction.find('p').text
data.append({
'name': name,
'description': description
})
# 存储数据,这里可以是字典列表、CSV文件、数据库等
with open('tourist_spots.csv', 'w', newline='', encoding='utf-8') as f:
writer = csv.DictWriter(f, fieldnames=['name', 'description'])
writer.writeheader()
writer.writerows(data)
else:
print("请求失败,状态码:", response.status_code)
阅读全文