python数据挖掘分类入门实验代码
时间: 2023-08-11 13:07:45 浏览: 97
python数据挖掘入门
以下是一个基本的Python数据挖掘分类入门实验代码示例,使用决策树算法对酒品进行分类。请注意,这只是一个示例,您需要根据自己的数据集和需求进行修改和调整。
```python
# 导入必要的库
import pandas as pd
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
# 读取数据集
data = pd.read_csv('wine_dataset.csv')
# 特征工程
X = data.drop(['Wine_Type'], axis=1)
y = data['Wine_Type']
# 划分数据集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
# 训练模型
model = DecisionTreeClassifier()
model.fit(X_train, y_train)
# 预测新数据
y_pred = model.predict(X_test)
# 模型评估
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy:", accuracy)
```
在这个示例中,我们首先导入了需要的库,然后读取了数据集。接下来,我们使用`drop`函数从数据中删除目标变量(即酒品类型),并将其分配给`X`变量。我们将目标变量分配给`y`变量。
然后,我们使用`train_test_split`函数将数据集分为训练集和测试集。在这个示例中,我们将测试集的大小设置为30%,并使用42作为随机种子。
接下来,我们使用`DecisionTreeClassifier`类创建一个决策树模型,并使用`fit`方法训练模型。然后,我们使用`predict`方法对测试集进行预测,并使用`accuracy_score`函数计算模型的准确率。
最后,我们打印出模型的准确率。
请注意,这只是一个基本示例。您可以根据自己的数据集和需求进行修改和调整,例如使用其他算法、进行特征选择、调整模型参数等。
阅读全文