给出随机森林进行excel数据分类的python代码
时间: 2024-01-02 22:03:57 浏览: 93
随机森林对数据分类的Python实现
下面是使用随机森林进行Excel数据分类的Python代码示例:
```python
import pandas as pd
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score
# 读取Excel文件
data = pd.read_excel('filename.xlsx')
# 将数据集分为训练集和测试集
train_set = data.sample(frac=0.8, random_state=0)
test_set = data.drop(train_set.index)
# 分离特征和目标变量
train_features = train_set.drop('target_variable', axis=1)
train_labels = train_set['target_variable']
test_features = test_set.drop('target_variable', axis=1)
test_labels = test_set['target_variable']
# 创建随机森林分类器
rf = RandomForestClassifier(n_estimators=100, random_state=0)
# 训练随机森林分类器
rf.fit(train_features, train_labels)
# 预测测试集的目标变量
predictions = rf.predict(test_features)
# 计算准确率
accuracy = accuracy_score(test_labels, predictions)
print('Accuracy:', accuracy)
```
其中,`filename.xlsx`是Excel文件名,`target_variable`是目标变量列的名称。在代码中,随机森林分类器使用了100个决策树。
阅读全文