利用Python对二手房市场进行数据分析的代码
时间: 2023-10-15 19:06:13 浏览: 38
以下是一个简单的Python代码示例,用于从链家网站抓取二手房房源信息,并对数据进行分析。该代码使用了Python的requests和BeautifulSoup库。
```python
import requests
from bs4 import BeautifulSoup
import pandas as pd
# 抓取链家网二手房房源信息
url = 'https://bj.lianjia.com/ershoufang/'
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}
response = requests.get(url, headers=headers)
soup = BeautifulSoup(response.text, 'html.parser')
# 提取房源信息
house_list = []
house_items = soup.find_all('li', {'class': 'clear'})
for house in house_items:
name = house.find('div', {'class': 'title'}).text.strip()
price = house.find('div', {'class': 'totalPrice'}).text.strip()
area = house.find('div', {'class': 'houseInfo'}).text.strip()
unit_price = house.find('div', {'class': 'unitPrice'}).text.strip()
house_list.append([name, price, area, unit_price])
# 将房源信息转换为DataFrame格式
df = pd.DataFrame(house_list, columns=['房源名称', '总价', '面积', '单价'])
# 进行数据分析
print('二手房平均总价:%.2f万元' % (df['总价'].astype('float').mean()))
print('二手房平均单价:%.2f元/平米' % (df['单价'].str.extract('(\d+)').astype('float').mean()))
print('面积最大的二手房:', df.loc[df['面积'].str.extract('(\d+)').astype('float').idxmax(), '房源名称'])
print('面积最小的二手房:', df.loc[df['面积'].str.extract('(\d+)').astype('float').idxmin(), '房源名称'])
```
该代码通过抓取链家网站的二手房房源信息,提取房源名称、总价、面积和单价等数据,并将其转换为DataFrame格式。然后,通过对数据进行分析,例如计算平均总价和单价、查找面积最大和最小的房源等等。您可以根据自己的需求进行修改和扩展。