url不是贝壳找房的网址
时间: 2023-12-27 13:04:13 浏览: 97
非常抱歉,我理解错了你的问题。以下是一个爬取贝壳找房网站二手房信息的 Python 爬虫代码,其中小区名从 Excel 文件中读取。同样需要安装 openpyxl 库来读取 Excel 文件,代码仅供学习参考,请勿用于商业用途。
```python
import requests
from bs4 import BeautifulSoup
from openpyxl import load_workbook
# 读取 Excel 文件
wb = load_workbook("小区列表.xlsx")
ws = wb.active
column = ws['A']
# 遍历小区列表
for cell in column:
if cell.value is not None:
# 构造请求 URL
url = f"https://wuxi.ke.com/ershoufang/pg1c{cell.value}/"
# 发送 GET 请求
response = requests.get(url)
# 解析 HTML
soup = BeautifulSoup(response.text, "html.parser")
# 获取房源信息
houses = soup.find_all("div", class_="info clear")
for house in houses:
# 输出房源信息
print(house.find("a", class_="LOGCLICKDATA").text.strip())
```
在代码中,我们同样通过 `load_workbook` 函数读取 Excel 文件,然后遍历第一列中的小区名,依次构造请求 URL 并发送 GET 请求。接着,我们使用 BeautifulSoup 解析 HTML 并获取房源信息,最后将房源信息输出到控制台。你可以根据需求进行修改,例如将房源信息保存到文件中等。
阅读全文