首页url不是贝壳找房的网址

url不是贝壳找房的网址

时间: 2023-12-27 13:04:13 浏览: 97

非常抱歉，我理解错了你的问题。以下是一个爬取贝壳找房网站二手房信息的 Python 爬虫代码，其中小区名从 Excel 文件中读取。同样需要安装 openpyxl 库来读取 Excel 文件，代码仅供学习参考，请勿用于商业用途。 ```python import requests from bs4 import BeautifulSoup from openpyxl import load_workbook # 读取 Excel 文件 wb = load_workbook("小区列表.xlsx") ws = wb.active column = ws['A'] # 遍历小区列表 for cell in column: if cell.value is not None: # 构造请求 URL url = f"https://wuxi.ke.com/ershoufang/pg1c{cell.value}/" # 发送 GET 请求 response = requests.get(url) # 解析 HTML soup = BeautifulSoup(response.text, "html.parser") # 获取房源信息 houses = soup.find_all("div", class_="info clear") for house in houses: # 输出房源信息 print(house.find("a", class_="LOGCLICKDATA").text.strip()) ``` 在代码中，我们同样通过 `load_workbook` 函数读取 Excel 文件，然后遍历第一列中的小区名，依次构造请求 URL 并发送 GET 请求。接着，我们使用 BeautifulSoup 解析 HTML 并获取房源信息，最后将房源信息输出到控制台。你可以根据需求进行修改，例如将房源信息保存到文件中等。

阅读全文