数据表中数据有面积，厅，室，地区，价格，并且数据类型是object,处理导入的数据转换成独热编码，书写随机森林进行预测房租的价格的python代码，输入房屋的面积，厅，室，地区的数据，计算模型的平均绝对误差

import pandas as pd from sklearn.preprocessing import LabelEncoder from sklearn.preprocessing import OneHotEncoder from sklearn.ensemble import RandomForestRegressor from sklearn.model_selection import train_test_split from sklearn.metrics import mean_absolute_error # 读取数据 data = pd.read_csv('data.csv') # 将厅、室、地区进行独热编码 le = LabelEncoder() data['厅'] = le.fit_transform(data['厅']) data['室'] = le.fit_transform(data['室']) data['地区'] = le.fit_transform(data['地区']) onehot_encoder = OneHotEncoder(sparse=False) onehot_encoded = onehot_encoder.fit_transform(data[['厅', '室', '地区']]) # 将独热编码后的数据合并到原数据表中 onehot_encoded_df = pd.DataFrame(onehot_encoded, columns=['厅0', '厅1', '厅2', '室0', '室1', '室2', '地区0', '地区1', '地区2', '地区3']) data = pd.concat([data, onehot_encoded_df], axis=1) # 处理数据类型 data['面积'] = pd.to_numeric(data['面积']) data['价格'] = pd.to_numeric(data['价格']) # 定义特征和目标变量 X = data[['面积', '厅0', '厅1', '厅2', '室0', '室1', '室2', '地区0', '地区1', '地区2', '地区3']] y = data['价格'] # 划分训练集和测试集 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42) # 建立随机森林模型 rf = RandomForestRegressor(n_estimators=100, random_state=42) rf.fit(X_train, y_train) # 预测测试集 y_pred = rf.predict(X_test) # 计算模型的平均绝对误差 mae = mean_absolute_error(y_test, y_pred) print('模型的平均绝对误差为：', mae) # 输入房屋的面积、厅、室、地区的数据进行预测 area = 70 ting = 1 shi = 2 diqu = '朝阳区' ting_encoded = onehot_encoder.transform(le.transform([ting]).reshape(-1, 1)) shi_encoded = onehot_encoder.transform(le.transform([shi]).reshape(-1, 1)) diqu_encoded = onehot_encoder.transform(le.transform([diqu]).reshape(-1, 1)) input_data = [area] + list(ting_encoded[0]) + list(shi_encoded[0]) + list(diqu_encoded[0]) input_data = [input_data] predicted_price = rf.predict(input_data) print('预测的价格为：', predicted_price[0])

阅读全文

数据表中数据有面积，厅，室，地区，价格，并且数据类型是object,处理导入的数据转换成独热编码，书写随机森林进行预测房租的价格的python代码，输入房屋的面积，厅，室，地区的数据，计算模型的平均绝对误差

相关推荐

C#泛型深度解析：数据类型判定与转换技巧

Java基础：byte[]与各类数据类型转换实例详解

JavaScript数据类型转换详解：显示与隐式转换

银行营销数据集分类：银行营销数据分类

Python字符串转JSON对象与数据分析：数据转换在数据分析中的作用

特征选择与独热编码的机器学习应用：结合技巧与案例

JSON数据数据库大数据处理挑战与机遇：海量数据存储和分析的探索

处理海量数据并提取见解：MATLAB回归分析中的大数据分析

【数据集成深度学习】：处理大规模数据集的深度学习策略

使用Python进行数据处理与分析

【LOB数据备份】：保障Oracle中LOB字段数据安全的6种策略

Muma包在R语言中的高效数据预处理：7大技巧提升数据质量！

【SNAP软件基础】：Sentinel-1数据处理第一步

探索性数据分析：用Pandas挖掘数据背后的秘密

Hadoop序列文件与MapReduce高级技巧：提升大数据处理效率的6大策略

HiGale数据分析利器：挖掘数据金矿的7个实用工具

YOLOv8数据清洗与规范化：数据集准备的科学方法

数据清洗的利器：揭秘Pandas预处理技术，提升数据质量！

数据分析中的特征工程和变量选择技术

PowerShell中的科学计算与数据分析应用

大家在看

mike21建模

网游诛仙分金鉴挖宝坐标计算器

stm32f7xx中文手册 RM0385

华为2403安装手册.

OpenCL 代码优化

最新推荐

C#实现Excel表数据导入Sql Server数据库中的方法

转换layUI的数据表格中的日期格式方法

机器学习数据中类别变量（categorical variable）的处理方法

js实现树形数据转成扁平数据的方法示例

Java基本数据类型与封装类型详解(int和Integer区别)

WildFly 8.x中Apache Camel结合REST和Swagger的演示

管理建模和仿真的文件

【声子晶体模拟全能指南】：20年经验技术大佬带你从入门到精通

2024-07-27怎么用python转换成农历日期

FDFS客户端Python库1.2.6版本发布