首页采用模拟浏览器爬虫去哪儿网https://piao.qunar.com景点信息数据并保存为csv文件的代码

采用模拟浏览器爬虫去哪儿网https://piao.qunar.com景点信息数据并保存为csv文件的代码

时间: 2024-01-17 13:03:51 浏览: 37

以下是一个简单的Python爬虫示例，可用于爬取去哪儿网的景点信息并将其保存为CSV文件： ```python import requests from bs4 import BeautifulSoup import csv # 设置请求头 headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'} # 设置URL url = 'https://piao.qunar.com/' # 发送请求 response = requests.get(url, headers=headers) # 解析HTML soup = BeautifulSoup(response.text, 'html.parser') # 获取所有景点信息 scenic_spots = soup.find_all('div', {'class': 'mp-description'}) # 将景点信息保存到CSV文件 with open('scenic_spots.csv', 'w', newline='', encoding='utf-8-sig') as file: writer = csv.writer(file) writer.writerow(['景点名称', '景点链接', '景点描述']) for spot in scenic_spots: name = spot.find('a').get_text() link = 'https://piao.qunar.com' + spot.find('a')['href'] description = spot.find('p').get_text() writer.writerow([name, link, description]) ``` 需要注意的几个点： - 由于去哪儿网的反爬虫机制比较严格，所以需要设置请求头模拟浏览器的请求。 - 使用BeautifulSoup解析HTML页面，定位到包含景点信息的标签，提取出景点名称、链接和描述信息。 - 使用CSV模块将景点信息写入CSV文件，注意设置编码格式和换行符。

最新推荐

采用模拟浏览器爬虫去哪儿网https://piao.qunar.com景点信息数据并保存为csv文件的代码

相关推荐

自己开发的一个python网页爬虫，模拟网页操作，爬取的内容可直接保存为为csv格式

tourSpotList:Py爬虫-基于echart可视化csv数数据（景点热度）

python爬虫无头浏览器技术selenium 自动抢piao源代码

爬取去哪儿网的5A旅游景点数据代码

帮我用python爬虫爬取携程网广州塔的评论并输入到csv文件

python爬虫爬取去哪儿网站景点

去哪儿网景点评论爬取

将数据集中图片和对应的txt文件按比例随机划分成十份，并保存至另外的文件夹

python爬虫携程景点

写一段大麦网抢票的python程序

python+opencv修改文件夹中图片亮度并保存至另一文件夹

Python opencv自动裁剪文件夹中图片指定区域并压缩成640×480，保存到另一文件夹

nn.Dropout是如何生效的

nn.dorpout失活还计算梯度吗

selenium抢体育馆

python 运行Service

python opencv将文件夹中的图像切割成四份，并且保存在另一个文件夹中

webstorm中暗转volar

最新推荐

2022物联网平台调研(氦氪、指令集、IOTOS、华为ROMA、jetLinks、AIRIOT)

工业AI视觉检测解决方案.pptx

管理建模和仿真的文件

MySQL运维最佳实践：经验总结与建议

stata面板数据画图

智慧医院信息化建设规划及愿景解决方案.pptx

"互动学习：行动中的多样性与论文攻读经历"

MySQL监控与预警：故障预防与快速响应

C语言MAKEU32函数

智慧医院信息化+智能化系统建设方案.pptx