首页如何用python的requests库爬取房天下的数据，并请其爬取到的数据存放在.csv文件夹中，要求爬取20页上海二手房房价数据和新房房价数据

如何用python的requests库爬取房天下的数据，并请其爬取到的数据存放在.csv文件夹中，要求爬取20页上海二手房房价数据和新房房价数据

时间: 2023-09-19 10:10:57 浏览: 113

好的，可以使用Python的requests库和BeautifulSoup库来实现。以下是代码示例： ```python import requests import csv from bs4 import BeautifulSoup # 定义请求头，模拟浏览器的请求 headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'} # 定义要爬取的页面数量 page_num = 20 # 定义要爬取的城市和房源类型 city = 'sh' house_type = ['esf', 'xf'] # 分别爬取二手房和新房的数据 for h_type in house_type: data_list = [] for page in range(1, page_num+1): # 构建URL url = f'https://{city}.{h_type}.fang.com/house/i3{page}/' # 发送请求 response = requests.get(url, headers=headers) # 解析HTML soup = BeautifulSoup(response.content, 'html.parser') house_list = soup.select('.houseList .info') # 提取数据 for house in house_list: title = house.select('.title a')[0].text.strip() price = house.select('.price .red')[0].text.strip() data_list.append([title, price]) # 将数据写入CSV文件 with open(f'{city}_{h_type}.csv', 'w', newline='', encoding='utf-8-sig') as f: writer = csv.writer(f) writer.writerow(['标题', '价格']) writer.writerows(data_list) print(f'{city} {h_type} 数据已写入CSV文件') ``` 以上代码会爬取上海二手房和新房的数据，每个类型爬取20页，将数据存储在.csv文件中，文件名格式为`城市_房源类型.csv`，例如`sh_esf.csv`和`sh_xf.csv`。

阅读全文

最新推荐

如何用python的requests库爬取房天下的数据，并请其爬取到的数据存放在.csv文件夹中，要求爬取20页上海二手房房价数据和新房房价数据

相关推荐

Python Requests库详解：高效数据爬取

Python pandas轻松爬取网页表格数据

Python实现微博数据爬取及数据存储教程

Python美女数据爬取秘籍

Qimai爬取七麦数据网APP榜单数据

股票历史数据爬取工具.zip

Flask+echarts爬取天气数据并完成可视化

【Python应用实战案例】-爬取新闻网站新闻（代码）.zip

Python爬虫项目.zip

maternity:这是一个爬取产后护理医院列表的项目。

python scrapy

vjudge_rank_python.7z

python-scraper

QQ-Groups-Spider-master-python.rarpython源码

douban_flask_pythonflask豆瓣_python_

python爬虫练习代码

wiki-tennis:WikimediaWikipedia项目的网球社区的Python脚本集合

Python爬取与分析上海二手房数据课程项目报告

利用Python进行上海二手房数据分析与爬取技巧

Python爬虫项目实战：Bilibili、CSU、Tuchong爬取案例

最新推荐

Python爬取数据并写入MySQL数据库的实例

Python爬取数据并实现可视化代码解析

Python爬虫爬取电影票房数据及图表展示操作示例

python实现网络爬虫 爬取北上广深的天气数据报告 python.docx

基于python的百度迁徙迁入、迁出数据爬取（爬虫大数据）（附代码）

JavaScript实现的高效pomodoro时钟教程

管理建模和仿真的文件

【WebLogic客户端兼容性提升秘籍】：一站式解决方案与实战案例

使用jupyter读取文件“近5年考试人数.csv”，绘制近5年高考及考研人数发展趋势图，数据如下（单位：万人）。

CMake 3.25.3版本发布：程序员必备构建工具

python实现网络爬虫爬取北上广深的天气数据报告 python.docx