python预测葡萄酒质量
时间: 2023-09-23 14:09:57 浏览: 181
python葡萄酒质量数据集预测
5星 · 资源好评率100%
要预测葡萄酒质量,可以使用Python中的机器学习算法,如线性回归、决策树、随机森林等。以下是一个使用随机森林算法预测葡萄酒质量的示例代码:
首先,导入所需的库和数据集:
```python
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score
# 读入数据集
wine_data = pd.read_csv('winequality-red.csv', sep=';')
```
接下来,对数据进行预处理和特征工程,将数据集分为训练集和测试集:
```python
# 预处理和特征工程
wine_data['quality_label'] = wine_data['quality'].apply(lambda x: 'low' if x <= 5 else 'medium' if x <= 7 else 'high')
wine_data = wine_data.drop('quality', axis=1)
X = wine_data.iloc[:, :-1]
y = wine_data.iloc[:, -1]
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
```
然后,使用随机森林算法进行训练和预测,并计算准确率:
```python
# 训练和预测
rf = RandomForestClassifier(n_estimators=100, random_state=42)
rf.fit(X_train, y_train)
y_pred = rf.predict(X_test)
# 计算准确率
accuracy = accuracy_score(y_test, y_pred)
print('Accuracy:', accuracy)
```
以上代码中,将葡萄酒质量标签分为低、中、高三个等级,并将其作为分类目标进行预测。最后输出的准确率可以反映出模型的预测效果。
阅读全文