#将cancer数据集中除第一列以外的所有列作为训练数据，存储在train_x变量中 train_y=cancer.iloc[:,0] #Z-score（正态分布方差规划化）规范化到[-3,3]之间，方差为1，均值为0 train_y=preprocessing.scale(train_y) train_y

这段代码看起来正确了，但是还是需要注意一下。第二行代码中，train_y应该是cancer数据集中的第一列（即目标变量），而不是train_x的前两个特征。因此，将第二行代码更改为以下内容应该才是正确的： ``` train_x = cancer.iloc[:, 1:] ``` 至于第三行代码，它将train_y中的所有值执行Z-score规范化，并将结果存储在train_y变量中。这是正确的方式，因为train_y是目标变量，应该在训练模型之前进行规范化。所以，这段代码应该是： ``` train_y = preprocessing.scale(train_y) ``` 这样才能对train_y执行Z-score规范化，而不是对train_x执行规范化。

#将cancer数据集中除第一列以外的所有列作为训练数据，存储在train_x变量中 train_y=cancer.iloc[:,1:] #Z-score（正态分布方差规划化）规范化到[-3,3]之间，方差为1，均值为0 train_y=preprocessing.scale(train_x) train_y

我注意到在第二行代码中，train_y应该是cancer数据集中的第一列（即目标变量），而不是除第一列以外的所有列。因此，将第二行代码更改为以下内容应该才是正确的： ``` train_y = cancer.iloc[:, 0] ``` 至于第三行代码，它将train_x中的所有特征执行Z-score规范化，并将结果存储在train_y变量中，这是不正确的。应该将其更改为以下代码： ``` train_x = preprocessing.scale(train_x) ``` 这样才能对train_x执行Z-score规范化，而不是对train_y执行规范化。

from sklearn.model_selection import train_test_split X_train, X_test, Y_train, Y_test = train_test_split = (cancer.data, cancer.target,stratify = cancer.traget,random_state = 66) from sklearn.preprocession import StandardSscaler nn = StandardScaler() X_train = nn.fit_transform(X_test) X_test = nn.transform(X_test) 修改后的代码

这段代码有一些错误，我来帮你修改一下： ``` from sklearn.model_selection import train_test_split from sklearn.preprocessing import StandardScaler from sklearn.datasets import load_breast_cancer cancer = load_breast_cancer() X_train, X_test, y_train, y_test = train_test_split( cancer.data, cancer.target, stratify=cancer.target, random_state=66) scaler = StandardScaler() X_train = scaler.fit_transform(X_train) X_test = scaler.transform(X_test) ``` 修改后的代码做了以下几个修改： 1. 增加了导入 `load_breast_cancer` 数据集的代码 2. 将 `train_test_split` 函数的赋值符号改为函数调用 3. 修正了 `stratify` 参数的拼写错误 4. 将 `Y_train` 和 `Y_test` 改为小写字母，并且和数据集的标签对应 5. 将 `StandardSscaler` 改为 `StandardScaler` 6. 增加了 `scaler` 变量来存储 `StandardScaler` 类的实例，并且使用 `fit_transform` 和 `transform` 方法对训练集和测试集进行了标准化处理

阅读全文

#将cancer数据集中除第一列以外的所有列作为训练数据，存储在train_x变量中 train_y=cancer.iloc[:,0] #Z-score（正态分布方差规划化）规范化到[-3,3]之间，方差为1，均值为0 train_y=preprocessing.scale(train_y) train_y

#将cancer数据集中除第一列以外的所有列作为训练数据，存储在train_x变量中 train_y=cancer.iloc[:,1:] #Z-score（正态分布方差规划化）规范化到[-3,3]之间，方差为1，均值为0 train_y=preprocessing.scale(train_x) train_y

相关推荐

训练数据集

决策树分类实验（乳腺癌）.zip_wpbc数据集_乳腺癌数据_决策树 cancer_决策树分类程序（使用乳腺癌数据集）_决策树数

breast-cancer-wisconsin.data.zip_breast_breast cancer_cancer_分类数

X_train,X_test,y_train,y_test=train_test_split(cancer.data,cancer.target,test_size=0.2)是什么意思

from sklearn.datasets import load_breast_cancer from sklearn.model_selection import train_test_split from sklearn.svm import SVC from sklearn.metrics import accuracy_score import time breast_cancer = load_breast_cancer() X = breast_cancer.data y = breast_cancer.target啥意思

Python代码实现测试训练良性恶性肿瘤数据，直接从sklearn导入如下 from sklearn.datasets import load_breast_cancer cancer = load_breast_cancer()

解释这段代码cancer='HNSC' train=pd.read_csv(dir_py+"\\tcga_data\\"+cancer+"\\ml_input.csv") target=pd.read_csv(dir_py+"\\tcga_data\\"+cancer+"\\tab_label.csv",index_col=0).values.ravel() indices = train.columns[2:] train=train.iloc[:,2:].T.values

解释这段代码train=pd.read_csv(dir_py+"\\tcga_data\\"+cancer+"\\ml_input.csv")

针对Breast_Cancer.csv中的数据，对其特征进行处理（先标准化、归一化，再利用逻辑回归或随机森林选择其中的top n特征，然后利用PCA将其降至m维），比较处理前后机器学习分类模型的性能差异。

利用python代码通过逻辑回归模型的sklearn的乳腺癌数据集进行二分类，这个也是sklearn完成（数据和逻辑回归的函数都集成在这里面）

请用svm算法在mindspore平台上对UCI乳腺癌数据进行分类，输出准确率

用python实现三个数据集的决策树模型

最新推荐

rhino grasshoper 框内物体排列（附视频）.gh

天池大数据比赛：伪造人脸图像检测技术

管理建模和仿真的文件

【Go测试框架端到端测试】：构建与优化集成测试流程

不使用temp怎么改写该程序

ADS1118数据手册中英文版合集

"互动学习：行动中的多样性与论文攻读经历"

【Go测试框架数据管理】：测试数据与状态的高效管理技术

用java编写20以内3的倍数的数字和个数和

Laravel 4/5包增强Eloquent模型本地化功能