请编写一个Python程序,利用机器学习库(如scikit-learn)实现一个简单的线性回归模型,预测房价。假设你有一个包含房屋面积(平方米)和对应房价(万元)的数据集。
时间: 2024-10-22 11:07:43 浏览: 33
首先,为了使用scikit-learn实现一个简单的线性回归模型预测房价,你需要完成以下几个步骤:
1. 导入必要的库:
```python
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score
```
2. 加载数据集(这里我们假设数据集名为'data.csv'):
```python
data = pd.read_csv('data.csv')
```
3. 数据预处理,包括拆分特征(X)和目标变量(y):
```python
X = data['房屋面积']
y = data['房价']
```
4. 划分训练集和测试集:
```python
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
```
5. 创建并训练线性回归模型:
```python
model = LinearRegression()
model.fit(X_train, y_train)
```
6. 预测测试集结果:
```python
y_pred = model.predict(X_test)
```
7. 评估模型性能(例如计算均方误差和R²分数):
```python
mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)
print(f"Mean Squared Error: {mse}")
print(f"R^2 Score: {r2}")
```
完整代码示例:
```python
# ... (以上所有步骤)
if __name__ == "__main__":
# ... (继续执行上述代码)
```
阅读全文