深圳房价预测并完成以下作业:Numpy数组数据;Pandas数据分析 ;Matplotlib可视化;sklearn机器学习算法;结果总结分析。写出代码
时间: 2023-11-22 11:53:45 浏览: 130
首先,我们需要收集深圳房价数据,然后进行数据分析和建模。以下是一个简单的示例代码,使用NumPy、Pandas、Matplotlib和Scikit-learn库:
```python
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error
# 加载数据
data = pd.read_csv('shenzhen_housing.csv')
# 数据预处理
data.dropna(inplace=True)
X = data.iloc[:, :-1].values
y = data.iloc[:, -1].values.reshape(-1, 1)
# 数据可视化
plt.scatter(X, y, color='blue')
plt.title('Shenzhen Housing Prices')
plt.xlabel('Area')
plt.ylabel('Price')
plt.show()
# 数据划分
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
# 线性回归模型
regressor = LinearRegression()
regressor.fit(X_train, y_train)
# 训练集结果可视化
plt.scatter(X_train, y_train, color='blue')
plt.plot(X_train, regressor.predict(X_train), color='red')
plt.title('Shenzhen Housing Prices')
plt.xlabel('Area')
plt.ylabel('Price')
plt.show()
# 测试集结果可视化
plt.scatter(X_test, y_test, color='blue')
plt.plot(X_train, regressor.predict(X_train), color='red')
plt.title('Shenzhen Housing Prices')
plt.xlabel('Area')
plt.ylabel('Price')
plt.show()
# 模型评估
y_pred = regressor.predict(X_test)
mse = mean_squared_error(y_test, y_pred)
rmse = np.sqrt(mse)
print('MSE:', mse)
print('RMSE:', rmse)
```
上述代码中,我们首先加载数据,然后进行数据预处理和可视化。接着,我们将数据分成训练集和测试集,并使用线性回归模型训练数据。最后,我们使用测试集评估模型,并计算均方误差和均方根误差。
通过以上步骤,我们可以对深圳房价进行预测,并得到预测结果的准确度评估。
阅读全文