iris_feature = u'花萼长度', u'花萼宽度', u'花瓣长度', u'花瓣宽度' path = 'iris.data' data = pd.read_csv(path, header=None) x_prime = data[list(range(4))] y = pd.Categorical(data[4]).codes x_prime_train, x_prime_test, y_train, y_test = train_test_split(x_prime, y, train_size=0.7, random_state=0)

这段代码是用于加载Iris数据集并进行训练集和测试集的划分。首先，定义了一个包含四个特征名称的元组iris_feature，分别是花萼长度、花萼宽度、花瓣长度和花瓣宽度。然后，指定了数据集文件的路径为'iris.data'，并使用pandas库的read_csv函数读取该文件，将数据存储在变量data中。接下来，将前四列数据提取出来作为特征矩阵x_prime。最后，使用train_test_split函数将x_prime和第五列数据（类别标签）y进行划分，将数据集划分为训练集和测试集，其中训练集占总数据的70%，随机种子为0。划分后的训练集特征矩阵为x_prime_train，训练集标签为y_train；测试集特征矩阵为x_prime_test，测试集标签为y_test。

def svmModel(x_train,x_test,y_train,y_test,type): if type=='rbf': svmmodel=svm.SVC(C=15,kernel='rbf',gamma=10,decision_function_shape='ovr') else: svmmodel=svm.SVC(C=0.1,kernel='linear',decision_function_shape='ovr') svmmodel.fit(x_train,y_train.ravel()) print('SVM模型:',svmmodel) train_accscore=svmmodel.score(x_train,y_train) test_accscore=svmmodel.score(x_test,y_test) n_support_numbers=svmmodel.n_support_ return svmmodel,train_accscore,test_accscore,n_support_numbers if name=='main': iris_feature='花萼长度','花萼宽度','花瓣长度','花瓣宽度' path="D:\data\iris(1).data" data=pd.read_csv(path,header=None) x,y=data[[0,1]],pd.Categorical(data[4]).codes x_train,x_test,y_train,y_test=train_test_split(x,y,random_state=3,train_size=0.6) type='linear' svmmodel,train_accscore,test_accscore,n_support_numbers=svmModel(x_train,x_test,y_train,y_test,type) print('训练集准确率：',train_accscore) print('测试机准确率：',test_accscore) print('支持向量的数目：',n_support_numbers) print('-' * 50) if name=='main': path='D:/data/iris1-100.data' data=pd.read_csv(path,header=None) x=data[list(range(2,4))] y=data[4].replace(['Iris-versicolor','Iris-virginica'],[0,1]) svmmodel_param=(('linear',0.1),('rbf',1,0.1),('rbf',5,5),('rbf',10,10)) for i, param in enumerate(svmmodel_param): svmmodel,title,accuracyscore=svmModel(x,y,param) y_predict=svmmodel.predict(x) print(title) print('准确率：',accuracyscore) print('支持向量的数目：',svmmodel.n_support_)

这是一个使用 SVM 进行分类的 Python 代码。其中使用了 iris 数据集来进行测试，通过调整 SVM 模型的参数，来比较不同模型在数据集上的准确率和支持向量的数目。其中 SVM 模型的参数包括 C 值和 kernel 值，C 值是惩罚系数，kernel 值决定了 SVM 模型的核函数。代码中使用了线性核函数和径向基函数（RBF）核函数。

from sklearn import datasets from pandas import DataFrame import pandas as pd x_data=datasets.load_iris().data #导入特征features y_data=datasets.load_iris().target #导入标签labels print("x_data from datasets: \n",x_data) print("y_data from datasets: \n",y_data) x_data=DataFrame(x_data,columns=['花萼长度','花萼宽度','花瓣长度','花瓣宽度']) pd.set_option('display.unicode.east_asian_width',True) #设置列名对齐 print("x_data add index: \n",x_data) x_data['类别']=y_data #新加一列，列标签为“类别” print("x_data add a column: \n",x_data)

这段代码使用scikit-learn库中的iris数据集作为示例，展示了如何导入数据并创建一个包含特征和标签的DataFrame对象。首先，使用`datasets.load_iris().data`和`datasets.load_iris().target`导入iris数据集的特征和标签。接着，使用`DataFrame()`将特征数据转换为DataFrame对象，并将其列名称设置为`['花萼长度','花萼宽度','花瓣长度','花瓣宽度']`。然后，使用`pd.set_option('display.unicode.east_asian_width',True)`设置列名称对齐。最后，使用`x_data['类别']=y_data`向DataFrame中添加一个新列，其列标签为“类别”，并将y_data作为该列的值。该代码的输出包括原始特征数据，添加列标签的特征数据，以及包含标签数据的DataFrame对象。

阅读全文

相关推荐

iris的花萼长度-数据集

irisdata.zip_MATLAB导入 iris_iris_iris.data.mat_iris_data.mat_iris

iris_data_files.zip_iris_iris data_iris matlab

feature_names=iris.feature_names, class_names=iris.target_names怎么确定

iris_X_train, iris_X_test, iris_y_train, iris_y_test = train_test_split(iris.data, iris.target, test_size=0.2)

df_iris = pd.read_csv(train_path,header=0,names=names)

iris_list=[] for row in iris_data: iris_list.append(tuple(row[1:])) iris_list什么意思

data = pd.DataFrame(iris.data, columns=iris.feature_names)代码作用

df = pd.DataFrame(iris.data, columns=iris.feature_names)

from sklearn.datasets import load_iris iris_dataset = load_iris()这段代码是什么意思？

x_train,x_test,y_train,y_test = train_test_split(iris.data,iris.target,test_size=0.2)是什么意思

cairo-devel-1.15.12-4.el7.x86_64.rpm.zip

abrt-devel-2.1.11-60.el7.centos.i686.rpm.zip

baobab-3.28.0-2.el7.x86_64.rpm.zip

anaconda-21.48.22.159-1.el7.centos.x86_64.rpm.zip

最新推荐

cairo-devel-1.15.12-4.el7.x86_64.rpm.zip

abrt-devel-2.1.11-60.el7.centos.i686.rpm.zip

baobab-3.28.0-2.el7.x86_64.rpm.zip

anaconda-21.48.22.159-1.el7.centos.x86_64.rpm.zip

amanda-libs-3.3.3-22.el7.x86_64.rpm.zip

Angular程序高效加载与展示海量Excel数据技巧

管理建模和仿真的文件

【SecureCRT高亮技巧】：20年经验技术大佬的个性化设置指南

如何设计一个基于FPGA的多功能数字钟，实现24小时计时、手动校时和定时闹钟功能？

Argos客户端开发流程及Vue配置指南