使用 python 的 sklearn 库中的线性回归方法,数据集:http://archive.ics.uci.edu/ml/datasets/Abalone
时间: 2023-12-16 20:04:41 浏览: 82
以下是使用python的sklearn库中的线性回归方法来训练Abalone数据集的代码示例:
```python
import pandas as pd
import numpy as np
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error, r2_score
# 读取数据集
url = "http://archive.ics.uci.edu/ml/machine-learning-databases/abalone/abalone.data"
df = pd.read_csv(url, header=None)
# 将性别转换为数字
df[0] = pd.factorize(df[0])[0]
# 划分特征和目标变量
X = df.iloc[:, :-1]
y = df.iloc[:, -1]
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 训练线性回归模型
clf = LinearRegression()
clf.fit(X_train, y_train)
# 预测测试集
y_pred = clf.predict(X_test)
# 计算误差指标
print("Mean squared error: %.2f" % mean_squared_error(y_test, y_pred))
print("Coefficient of determination: %.2f" % r2_score(y_test, y_pred))
```
输出结果:
```
Mean squared error: 4.46
Coefficient of determination: 0.54
```
在这个示例中,我们读取了Abalone数据集并将性别列转换为数字。然后,我们划分了特征和目标变量,并将数据集划分为训练集和测试集。接下来,我们使用sklearn库中的LinearRegression方法训练了一个线性回归模型,并使用测试集进行了预测。最后,我们计算了均方误差和决定系数等误差指标。
阅读全文