使用python语言爬取携程旅行网站的500条数据保存到表格里

时间: 2024-03-29 08:38:53 浏览: 68

基于python实现爬取携程景点数据与评论数据源码+项目说明.zip

5星 · 资源好评率100%

好的，我可以帮你解决这个问题。首先，我们需要安装一些必要的库，包括`requests`和`BeautifulSoup`，可以使用以下命令安装： ``` pip install requests pip install beautifulsoup4 ``` 然后，我们可以编写Python代码来爬取携程旅行网站的500条数据并保存到表格里。以下是一个示例代码： ```python import requests from bs4 import BeautifulSoup import csv # 设置请求头信息 headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'} # 爬取500页数据 for i in range(1, 501): url = 'https://hotels.ctrip.com/hotel/shanghai2/p' + str(i) response = requests.get(url, headers=headers) soup = BeautifulSoup(response.text, 'html.parser') # 从页面中提取数据 hotel_list = soup.find_all('li', class_='hotel_item') data = [] for hotel in hotel_list: name = hotel.find('h2').text.strip() address = hotel.find('p', class_='hotel_item_htladdress').text.strip() score = hotel.find('span', class_='hotel_value').text.strip() data.append([name, address, score]) # 将数据保存到CSV文件中 with open('hotels.csv', 'a', encoding='utf-8-sig', newline='') as f: writer = csv.writer(f) writer.writerows(data) ``` 这段代码会爬取携程旅行网站上上海地区的酒店信息，每页包含10条数据，共爬取500页，总共5000条数据。爬取的数据包括酒店名称、地址和评分，并将数据保存到名为`hotels.csv`的CSV文件中。注意，这个代码可能需要一些时间来运行，因为它需要爬取大量的数据。希望这个示例代码能帮助到你。如果你有其他问题，请随时问我！

阅读全文

使用python语言爬取携程旅行网站的500条数据保存到表格里

相关推荐

Python爬取携程网与南京相关的游记数据

携程机票python爬取脚本

基于python爬取携程旅游网站旅游景点数据及评论数据项目源码（python大作业）.zip

python爬虫爬取网页表格数据

毕业设计-基于python实现的爬取携程景点数据和评论数据+源代码+文档说明

基于Python爬取携程网与南京相关的游记数据.zip

python爬取携程网评论.zip

python爬取飞猪网站旅游景点数据并保存excel

Python 爬取携程所有机票的实例代码

使用Python实现网络爬虫技术，爬取携程网与南京相关的游记数据

python如何爬取网站数据并进行数据可视化

如何使用python爬虫爬取要登陆的网站

从DOM分析，使用python开始爬取央视新闻网站.pdf

使用Python爬虫爬取图书封面

python爬虫爬取网页数据并解析数据

利用python语言爬取网站小说资源并利用word cloud 和jieba分词分析得出词云

python爬取招聘数据保存到mysql数据库

使用Python爬取携程酒店评论的高效方法

Python爬虫实战：爬取携程热门游记数据与分析

最新推荐

Python爬取数据保存为Json格式的代码示例

Python爬虫进阶之多线程爬取数据并保存到数据库

Python爬取数据并写入MySQL数据库的实例

Python爬虫爬取电影票房数据及图表展示操作示例

Python爬取数据并实现可视化代码解析

探索数据转换实验平台在设备装置中的应用

管理建模和仿真的文件

ggflags包的国际化问题：多语言标签处理与显示的权威指南

如何使用MATLAB实现电力系统潮流计算中的节点导纳矩阵构建和阻抗矩阵转换，并解释这两种矩阵在潮流计算中的作用和差异？

使用git-log-to-tikz.py将Git日志转换为TIKZ图形