二手房随机森林数据分析代码
时间: 2024-03-25 20:34:25 浏览: 21
当进行二手房数据分析时,可以使用随机森林算法进行预测和特征选择。下面是一个简单的二手房随机森林数据分析代码示例:
```python
# 导入所需的库
import pandas as pd
from sklearn.ensemble import RandomForestRegressor
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error
# 读取数据集
data = pd.read_csv('二手房数据.csv')
# 数据预处理
# ...
# 划分特征和目标变量
X = data.drop('房屋价格', axis=1)
y = data['房屋价格']
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 创建随机森林回归模型
rf_model = RandomForestRegressor(n_estimators=100, random_state=42)
# 拟合模型
rf_model.fit(X_train, y_train)
# 预测测试集
y_pred = rf_model.predict(X_test)
# 评估模型
mse = mean_squared_error(y_test, y_pred)
print('均方误差(MSE):', mse)
# 特征重要性排序
feature_importances = rf_model.feature_importances_
sorted_indices = feature_importances.argsort()[::-1]
sorted_features = X.columns[sorted_indices]
# 打印特征重要性排序结果
print('特征重要性排序:')
for feature in sorted_features:
print(feature)
```
这段代码使用了随机森林回归模型对二手房数据进行预测,并计算了均方误差(MSE)作为评估指标。同时,还展示了特征重要性排序的结果。