数据分析,对 链家北京租房数据分析文件中将小区名称对应的均价信息绘制纵向条形统计图,并将“户型”与“面积”作为参考数据进行售价预测,绘制售价预测分析图的代码。
时间: 2023-11-27 18:51:13 浏览: 92
首先,我们需要导入一些必要的库和数据集:
```python
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
df = pd.read_csv('lianjia.csv')
```
接下来,我们将小区名称对应的均价信息绘制纵向条形统计图:
```python
plt.figure(figsize=(20, 10))
sns.barplot(x='小区名称', y='均价', data=df)
plt.xticks(rotation=90)
plt.title('北京租房小区均价统计图')
plt.show()
```
然后,我们使用“户型”和“面积”作为参考数据进行售价预测,并绘制售价预测分析图:
```python
# 构造特征矩阵X和目标变量y
X = df[['户型', '面积']]
y = df['售价']
# 划分训练集和测试集
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 训练模型
from sklearn.linear_model import LinearRegression
model = LinearRegression()
model.fit(X_train, y_train)
# 预测测试集
y_pred = model.predict(X_test)
# 绘制预测结果分析图
plt.scatter(y_test, y_pred)
plt.plot([y_test.min(), y_test.max()], [y_test.min(), y_test.max()], 'r--')
plt.xlabel('实际售价')
plt.ylabel('预测售价')
plt.title('链家北京租房售价预测分析图')
plt.show()
```
这样就可以得到小区名称对应的均价信息绘制纵向条形统计图和售价预测分析图了。
阅读全文