import matplotlib.pyplot as plt import pandas as pd df = pd.read_excel(r"db聚类专用版.xlsx") df.head() from sklearn.model_selection import train_test_split #数据划分 X = df[["Bridge length (m)","Structural type","Pier type","Foundation type", "Bearing type","Plane linear"]] y = df[['Vulnerability grade']] xtrain, xtest, ytrain, ytest =\ train_test_split(X, y, test_size=0.2, random_state=100) from sklearn.ensemble import RandomForestClassifier rf = RandomForestClassifier( n_estimators=100, random_state=8 ) rf.fit(xtrain, ytrain) #预测训练集结果 train_predicted = rf.predict(xtrain)
时间: 2024-01-04 17:01:57 浏览: 144
import numpy as np import matplotlib.pyplot as plt import math
你好!这段代码使用了 `matplotlib.pyplot` 和 `pandas` 库,并读取了一个名为 "db聚类专用版.xlsx" 的 Excel 文件。
接下来,使用 `pandas` 的 `read_excel()` 函数将 Excel 文件读取为一个名为 `df` 的 DataFrame 对象,并调用 `head()` 方法显示前几行数据。
然后,从 `df` 中选择了一些特征列作为输入变量 `X`,选择了一个目标列作为输出变量 `y`。
接下来,使用 `train_test_split()` 函数将数据集划分为训练集和测试集。其中,`X` 是输入数据,`y` 是目标变量,`test_size=0.2` 表示将数据划分为 80% 的训练集和 20% 的测试集,`random_state=100` 表示设置随机种子以确保可重复性。
然后,导入了 `RandomForestClassifier` 类,并创建了一个名为 `rf` 的随机森林分类器对象。其中,`n_estimators=100` 表示决策树数量为 100,`random_state=8` 表示设置随机种子以确保可重复性。
接下来,使用训练集的数据 `xtrain` 和目标变量 `ytrain` 调用 `fit()` 方法来训练随机森林分类器模型。
最后,使用训练集的数据 `xtrain` 调用 `predict()` 方法来预测训练集的结果,将预测结果存储在变量 `train_predicted` 中。
阅读全文