请分别提供岭回归、逻辑回归、决策树的Python代码
时间: 2023-03-13 19:46:02 浏览: 60
岭回归:from sklearn.linear_model import Ridgeclf = Ridge(alpha=1.0)
clf.fit(X_train, y_train)逻辑回归:from sklearn.linear_model import LogisticRegressionclf = LogisticRegression(random_state=0).fit(X_train, y_train)决策树:from sklearn.tree import DecisionTreeClassifierclf = DecisionTreeClassifier(random_state=0)
clf.fit(X_train, y_train)
相关问题
python岭回归代码
岭回归是一种有偏估计,用于处理特征数多于样本的情况,同时也可以解决多重共线性的问题。下面是Python中实现岭回归的代码:
```
import numpy as np
from sklearn.linear_model import Ridge
# 创建一个岭回归模型
ridge = Ridge(alpha=1.0)
# 训练模型
X_train = np.array([[1, 2], [3, 4], [5, 6]])
y_train = np.array([1, 2, 3])
ridge.fit(X_train, y_train)
# 预测
X_test = np.array([[7, 8], [9, 10]])
y_pred = ridge.predict(X_test)
print(y_pred)
```
在这个例子中,我们使用了scikit-learn库中的Ridge类来创建一个岭回归模型。我们使用了一个包含3个样本和2个特征的训练集来训练模型,并使用一个包含2个样本和2个特征的测试集来进行预测。在训练模型时,我们设置了alpha参数为1.0,这是岭回归中的一个重要参数,用于控制模型的复杂度。最后,我们输出了预测结果。
基于岭回归实现空气质量预测的python代码
以下基于岭回归实现空气质量预测的Python代码:
```python
import pandas as pd
import numpy as np
from sklearn.linear_model import Ridge
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error
# 读取数据
data = pd.read_csv('air_quality.csv')
# 提取特征和标签
X = data.iloc[:, :-1]
y = data.iloc[:, -1]
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
# 岭回归模型
ridge = Ridge(alpha=0.5)
ridge.fit(X_train, y_train)
# 预测
y_pred = ridge.predict(X_test)
# 评估
rmse = np.sqrt(mean_squared_error(y_test, y_pred))
print('RMSE:', rmse)
```
其中,'air_quality.csv'为数据文件名,需自行准备。数据格式为:第一列为PM2.5浓度,后面的列为特征,共计7个特征。alpha为岭回归系数,可调整。