利用sklearn 的 logistic 分类函数的使用,并用来对西瓜数据集3.0a进行分类
时间: 2024-05-02 12:22:53 浏览: 114
好的,让我来回答你的问题。
首先,我们需要导入需要使用的库,这里我们用到了 numpy, pandas 和 sklearn:
```
import numpy as np
import pandas as pd
from sklearn.linear_model import LogisticRegression
```
接着,我们需要读取西瓜数据集3.0a:
```
data = pd.read_csv('watermelon_3a.csv')
```
数据集一共有8列,包括编号、密度、含糖量、好瓜、纹理、根蒂、敲声和色泽,我们只需要密度和含糖量这两列作为特征,好瓜作为标签,所以可以将数据集中的这三列抽取出来:
```
X = np.array(data[['density', 'sugar']])
y = np.array(data['good'])
```
接着,我们将数据集划分为训练集和测试集:
```
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=0)
```
然后,我们可以使用 logistic 分类函数进行模型训练和测试:
```
clf = LogisticRegression(solver='liblinear', C=1)
clf.fit(X_train, y_train)
y_pred = clf.predict(X_test)
print('Accuracy: {}'.format(np.mean(y_pred == y_test)))
```
在这里,我们使用了 liblinear 作为 solver,C=1 作为正则化参数。最后打印出分类的准确率。
这就是利用 sklearn 的 logistic 分类函数进行分类的方法。希望能对你有所帮助!
阅读全文