import requests from bs4 import BeautifulSoup import pandas as pd get_house_info (url) eaders = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'} response = requests.get(url, headers=headers) soup = BeautifulSoup(response.text, 'html.parser') house_list = soup.find_all('li', class_='clear') house_info_list :list[dict[str,int]]= [] for i,house in enumerate(house_list,start=1): info = {} info['id'] = i info['title'] = house.find('div', class_='title').text.strip() info['positionInfo'] = house.find('div', class_='positionInfo').text.strip() info['address'] = house.find('div', class_='address').text.strip() info['followInfo'] = house.find('div', class_='followInfo').text.strip() info['flood'] = house.find('div', class_='flood').text.strip() info['priceInfo'] = house.find('div', class_='priceInfo').text.strip() house_info_list.append(info) return house_info_list save_to_excel(house_info_list, file_name) df = pd.DataFrame(house_info_list) df.to_excel(file_name, index=False) if __name__ == '__main__': url = 'https://nj.lianjia.com/ershoufang/' #修改链接为当地链接 house_info_list = [] for i in range(1, 21): # 收集20页的数据，大约400条 page_url = f'{url}pg{i}/' house_info_list.extend(get_house_info(page_url)) save_to_excel(house_info_list, 'house.xlsx') 怎么修改return_info_house的错误

import requests from bs4 import BeautifulSoup import pandas as pd import xlrd # 读取Excel文件中的小区名字 def read_excel(filename): data = pd.read_excel(filename) return data['小区名'].tolist() # 爬取二手房数据 def crawl_data(area): print(area) print('1') url = 'https://wx.ke.com/ershoufang/rs'+area # 无锡二手房页面 headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36 Edge/16.16299' } params = { 'kw': area } response = requests.get(url, headers=headers, params=params) soup = BeautifulSoup(response.text, 'html.parser') # 解析页面数据 result = [] house_list = soup.find_all('div', class_='info clear') for house in house_list: title = house.find('div', class_='title').text.strip() address = house.find('div', class_='address').text.strip() house_Info = house.find('div', class_='houseInfo').text.strip() priceInfo = house.find('div', class_='priceInfo').text.strip() followInfo = house.find('div', class_='followInfo').text.strip() result.append({ 'title': title, 'address': address, 'house_info':house_Info, 'priceInfo':priceInfo, 'followInf':followInfo }) return result # 将数据保存到Excel文件中 def save_to_excel(data, filename): df = pd.DataFrame(data) df.to_excel(filename, index=False) # 主函数 if name == 'main': areas = read_excel('小区名.xlsx') for area in areas: print('正在爬取：', area) data = crawl_data(area) save_to_excel(data, area + '.xlsx') print('爬取完成！')

爬取时，程序将小区名字作为参数拼接到目标 URL 中，然后使用 requests 库发送 GET 请求获取 HTML 页面，再使用 BeautifulSoup 库解析 HTML 页面，提取出需要的信息，并将结果保存到一个列表中。最后，程序将列表中...

数据分析(Python+numpy+pandas+matplotlib分析58同城成都房价)

from bs4 import BeautifulSoup url = 'https://cd.58.com/ershoufang/' headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 ...

python爬虫--房产数据爬取并保存本地

from bs4 import BeautifulSoup import pandas as pd # 发送 HTTP 请求获取网页内容 url = 'https://bj.lianjia.com/ershoufang/' headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) Apple...

python二手房使用教程_python爬虫爬取链家二手房信息

from bs4 import BeautifulSoup import pandas as pd 3. 定义函数获取页面信息 python def get_page(url): headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 ...

解决Python调试import requests报错及环境变量配置

"在调试Python文件时遇到import requests错误，主要是因为系统环境中缺少requests库。本文将指导你如何解决这个问题，包括环境变量的配置和使用pip安装requests库的步骤。" 在Python编程中，import requests是...

pandas_maxminddb-0.1.1：扩展Pandas数据分析库的新工具

资源摘要信息:"pandas_maxminddb-0.1.1.tar.gz" 标题分析: 标题中的 "pandas_maxminddb-0.1.1.tar.gz" 表明这是一个以 tar.gz 格式压缩的 Python 库文件，版本号为 0.1.1。该文件名暗示这个库可能与 Python 中著名...

Scratch图形化编程语言入门与进阶指南

内容概要：本文全面介绍了Scratch编程语言，包括其历史、发展、特点、主要组件以及如何进行基本和进阶编程操作。通过具体示例，展示了如何利用代码块制作动画、游戏和音乐艺术作品，并介绍了物理模拟、网络编程和扩展库等功能。适合人群：编程初学者、教育工作者、青少年学生及对编程感兴趣的各年龄段用户。使用场景及目标：①帮助初学者理解编程的基本概念和逻辑；②提高学生的创造力、逻辑思维能力和问题解决能力；③引导用户通过实践掌握Scratch的基本和高级功能，制作个性化作品。其他说明：除了基础教学，文章还提供了丰富的学习资源和社区支持，帮助用户进一步提升技能。

mmexport1734874094130.jpg

基于simulink的悬架仿真模型，有主动悬架被动悬架天棚控制半主动悬架 1基于pid控制的四自由度主被动悬架仿真模型 2基于模糊控制的二自由度仿真模型，对比pid控制对比被动控制，的比较说明

基于simulink的悬架仿真模型，有主动悬架被动悬架天棚控制半主动悬架 [1]基于pid控制的四自由度主被动悬架仿真模型 [2]基于模糊控制的二自由度仿真模型，对比pid控制对比被动控制，的比较说明 [3]基于天棚控制的二自由度悬架仿真以上模型，说明文档齐全，仿真效果明显

【组合数学答案】组合数学-苏大李凡长版-课后习题答案

内容概要：本文档是《组合数学答案-网络流传版.pdf》的内容，主要包含了排列组合的基础知识以及一些经典的组合数学题目。这些题目涵盖了从排列数计算、二项式定理的应用到容斥原理的实际应用等方面。通过对这些题目的解析，帮助读者加深对组合数学概念和技巧的理解。适用人群：适合初学者和有一定基础的学习者。使用场景及目标：可以在学习组合数学课程时作为练习题参考，也可以在复习考试或准备竞赛时使用，目的是提高解决组合数学问题的能力。其他说明：文档中的题目覆盖了组合数学的基本知识点，适合逐步深入学习。每个题目都有详细的解答步骤，有助于读者掌握解题思路和方法。

YOLO算法-雨水排放涵洞模型数据集-1000张图像带标签-.zip

YOLO系列算法目标检测数据集，包含标签，可以直接训练模型和验证测试，数据集已经划分好，包含数据集配置文件data.yaml，适用yolov5,yolov8,yolov9,yolov7,yolov10,yolo11算法；包含两种标签格:yolo格式（txt文件）和voc格式（xml文件），分别保存在两个文件夹中，文件名末尾是部分类别名称; yolo格式：<class> <x_center> <y_center> <width> <height>，其中： <class> 是目标的类别索引（从0开始）。 <x_center> 和 <y_center> 是目标框中心点的x和y坐标，这些坐标是相对于图像宽度和高度的比例值，范围在0到1之间。 <width> 和 <height> 是目标框的宽度和高度，也是相对于图像宽度和高度的比例值；【注】可以下拉页面，在资源详情处查看标签具体内容；

操作系统实验 Ucore lab5

学生成绩管理系统软件界面

基于matlab开发的学生成绩管理系统GUI界面，可以实现学生成绩载入，显示，处理及查询。

NVR-K51-BL-CN-V4.50.010-210322

老版本4.0固件，(.dav固件包），支持7700N-K4,7900N-K4等K51平台，升级后出现异常或变砖可使用此版本。请核对自己的机器信息，确认适用后在下载。

YOLO算法-塑料数据集-7张图像带标签-塑料.zip

YOLO系列算法目标检测数据集，包含标签，可以直接训练模型和验证测试，数据集已经划分好，包含数据集配置文件data.yaml，适用yolov5,yolov8,yolov9,yolov7,yolov10,yolo11算法；包含两种标签格:yolo格式（txt文件）和voc格式（xml文件），分别保存在两个文件夹中，文件名末尾是部分类别名称; yolo格式：<class> <x_center> <y_center> <width> <height>，其中： <class> 是目标的类别索引（从0开始）。 <x_center> 和 <y_center> 是目标框中心点的x和y坐标，这些坐标是相对于图像宽度和高度的比例值，范围在0到1之间。 <width> 和 <height> 是目标框的宽度和高度，也是相对于图像宽度和高度的比例值；【注】可以下拉页面，在资源详情处查看标签具体内容；

YOLO算法-杂草检测项目数据集-3970张图像带标签-杂草.zip

E008 库洛米（3页）.zip

相关推荐

Requests_from_file-2.2: Python库文件下载与使用指南

随机User-Agent策略：防止爬虫的简单方法

探索pandas_market_calendars-1.2：Python数据分析与日历集成

数据分析(Python+numpy+pandas+matplotlib分析58同城成都房价)

python爬虫--房产数据爬取并保存本地

python二手房使用教程_python爬虫爬取链家二手房信息

解决Python调试import requests报错及环境变量配置

pandas_maxminddb-0.1.1：扩展Pandas数据分析库的新工具

Scratch图形化编程语言入门与进阶指南

mmexport1734874094130.jpg

基于simulink的悬架仿真模型，有主动悬架被动悬架天棚控制半主动悬架 1基于pid控制的四自由度主被动悬架仿真模型 2基于模糊控制的二自由度仿真模型，对比pid控制对比被动控制，的比较说明

【组合数学答案】组合数学-苏大李凡长版-课后习题答案

YOLO算法-雨水排放涵洞模型数据集-1000张图像带标签-.zip

操作系统实验 Ucore lab5

学生成绩管理系统软件界面

NVR-K51-BL-CN-V4.50.010-210322

YOLO算法-塑料数据集-7张图像带标签-塑料.zip

YOLO算法-杂草检测项目数据集-3970张图像带标签-杂草.zip

E008 库洛米（3页）.zip

最新推荐

Scratch图形化编程语言入门与进阶指南

mmexport1734874094130.jpg

基于simulink的悬架仿真模型，有主动悬架被动悬架天棚控制半主动悬架 1基于pid控制的四自由度主被动悬架仿真模型 2基于模糊控制的二自由度仿真模型，对比pid控制对比被动控制，的比较说明

【组合数学答案】组合数学-苏大李凡长版-课后习题答案

YOLO算法-雨水排放涵洞模型数据集-1000张图像带标签-.zip

Java毕业设计项目：校园二手交易网站开发指南

管理建模和仿真的文件

【MVC标准化：肌电信号处理的终极指南】：提升数据质量的10大关键步骤与工具

能否提供一个在R语言中执行Framingham数据集判别分析的详细和完整的代码示例？

Blaseball Plus插件开发与构建教程