首页编写一个爬虫爬取无锡二手房小区从excel里获取

编写一个爬虫爬取无锡二手房小区从excel里获取

时间: 2024-02-01 18:04:53 浏览: 41

下面是一个简单的 Scrapy 爬虫，用于从 Excel 文件中获取小区信息，并爬取无锡市的二手房信息。请先确保已经安装好了 pandas 和 openpyxl 库，以便从 Excel 文件中读取数据。 ```python import scrapy import pandas as pd class WuxiErshoufangSpider(scrapy.Spider): name = "wuxi_ershoufang" allowed_domains = ["lianjia.com"] def start_requests(self): # 从 Excel 文件中读取小区名称 df = pd.read_excel("小区信息.xlsx") xiaoqu_list = df["小区名称"].tolist() # 构造爬取请求 for xiaoqu in xiaoqu_list: url = f"https://wuxi.lianjia.com/ershoufang/rs{xiaoqu}/" yield scrapy.Request(url=url, callback=self.parse) def parse(self, response): # 解析二手房信息 ershoufang_list = response.css(".sellListContent li") for ershoufang in ershoufang_list: title = ershoufang.css(".title a::text").get() address = ershoufang.css(".address .houseInfo::text").get() price = ershoufang.css(".priceInfo .totalPrice::text").get() yield { "小区名称": response.url.split("/")[-2].replace("rs", ""), "标题": title, "地址": address, "价格": price } ``` 上面的代码通过读取名为“小区信息.xlsx”的 Excel 文件中的小区名称列表，构造了多个爬取请求。对于每个请求，它会访问链家网站上的二手房页面，并解析页面中的二手房信息。最后，将小区名称、标题、地址和价格等信息保存到字典中并返回。注意，上面的代码中的 Excel 文件名和列名都需要根据实际情况进行修改。此外，还需要在 Scrapy 项目的 settings.py 文件中添加以下代码，以便正确读取中文： ```python FEED_EXPORT_ENCODING = 'utf-8-sig' ```

最新推荐

编写一个爬虫爬取无锡二手房 小区从excel里获取

相关推荐

Python爬虫-scrapy-城市二手房数据爬取与保存

用python编写爬虫，爬取房产信息

python爬虫 爬取58同城上所有城市的租房信息详解

网络爬虫爬取链家二手房数据

python爬取二手房信息_python爬虫爬取链家二手房信息

用python帮我写一个爬虫爬取租房信息的代码

编写一个使用requests+BeautifulSoup的python爬虫爬取页面的模板

爬虫爬取哔哩哔哩并处理数据导入excel

python爬虫爬取链家南京二手房信息400条

用Python编写一个能够爬取王者荣耀赛事数据的爬虫程序

写一个爬虫爬取boss直聘网站

用python写一个爬虫爬取音乐

爬虫爬取网站信息并放入excel表格

用python写一个爬虫爬取指定电影

编写一个爬取网页的python爬虫函数

用python 写一个爬虫 爬取网页数据

用python编写爬虫，爬取二手车信息，附加自己写的35页报告

一步步教你用python的scrapy编写一个爬虫

Python爬虫爬取微信朋友圈

最新推荐

Python爬虫爬取电影票房数据及图表展示操作示例

python爬虫框架scrapy实战之爬取京东商城进阶篇

python 实现读取一个excel多个sheet表并合并的方法

Python爬虫之Scrapy（爬取csdn博客）

C 语言编写一个网络蜘蛛（网络爬虫）

BSC关键绩效财务与客户指标详解

管理建模和仿真的文件

【实战演练】俄罗斯方块：实现经典的俄罗斯方块游戏，学习方块生成和行消除逻辑。

卷积神经网络实现手势识别程序

绘制企业战略地图：从财务到客户价值的六步法

编写一个爬虫爬取无锡二手房小区从excel里获取

python爬虫爬取58同城上所有城市的租房信息详解

用python 写一个爬虫爬取网页数据