pca = PCA(n_components=7) newX = pca.fit_transform(X) x_data = ['PC1','PC2','PC3','PC4','PC5','PC6','PC7'] y_data = np.around(pca.explained_variance_ratio_, 2) plt.bar(x=x_data, height=y_data,color='steelblue', alpha=0.8) plt.show() PCA_data = pd.DataFrame(newX, columns=['PC1', 'PC2', 'PC3', 'PC4', 'PC5', 'PC6', 'PC7']) correlation_matrix = PCA_data.corr() sns.heatmap(correlation_matrix, cmap='coolwarm', annot=True) plt.show() 上述代码是对数据进行主成分分析，展示每个主成分的贡献率，并计算所有主成分之间的皮尔逊相关系数，并用热图Heatmap的形式展示出来，请在上述代码基础上，请给出下一步的代码，要求是：划分训练集测试集，只使用前两个主成分作为自变量训练逻辑回归模型，并在测试集上测试模型预测效果。显示模型预测的准确率，显示模型的混淆矩阵，试着画出ROC曲线

时间: 2023-06-05 21:05:04 浏览: 109

下一步的代码如下： # 划分训练集和测试集 from sklearn.model_selection import train_test_split X_train, X_test, y_train, y_test = train_test_split(newX[:,:2], y, test_size=0.3, random_state=42) # 训练逻辑回归模型 from sklearn.linear_model import LogisticRegression logreg = LogisticRegression() logreg.fit(X_train, y_train) # 在测试集上测试模型预测效果 y_pred = logreg.predict(X_test) # 显示模型预测的准确率 from sklearn.metrics import accuracy_score accuracy = accuracy_score(y_test, y_pred) print("模型预测准确率为：", accuracy) # 显示模型的混淆矩阵 from sklearn.metrics import confusion_matrix conf_mat = confusion_matrix(y_test, y_pred) print("模型的混淆矩阵为：\n", conf_mat) # 画ROC曲线 from sklearn.metrics import roc_curve, roc_auc_score fpr, tpr, thresholds = roc_curve(y_test, y_pred) roc_auc = roc_auc_score(y_test, y_pred) plt.plot(fpr, tpr, label='ROC曲线 (AUC = %0.2f)' % roc_auc) plt.plot([0, 1], [0, 1], 'r--') plt.title('ROC曲线') plt.xlabel('假正率(FPR)') plt.ylabel('真正率(TPR)') plt.legend(loc="lower right") plt.show()

阅读全文

相关推荐

Linux v2.13.6版本下的I2C复用器pca954x驱动支持

PCA954x I2C多路复用器驱动支持

Linux下PCA954x I2C多路复用器驱动解析

pca = PCA(n_components=2) X_pca = pca.fit_transform(pred_images)，如何用散点图可视化啊

n_components = 16 pca = PCA(n_components=n_components, svd_solver='randomized',whiten=True).fit(X_train) X_train_pca = pca.transform(X_train)

解释pca = PCA(n_components = 2) #训练数据 x=pca.fit_transform(df.values)

pca = PCA(n_components=2) X_pca = pca.fit_transform(pred_images)如果用散点图来对这降维后的二维数组进行可视化，横坐标和纵坐标代表PCA降维后的样本数量和降维后的特征数吗

from sklearn.decomposition import PCA def pca_demo(data): transfer = PCA(n_components=0.92) data_new = transfer.fit_transform(data) print(data_new) return data_new if __name__ == '__main__': X_new = pca_demo(X_new)注释

pca = PCA(n_components=2) X_pca = pca.fit_transform(pred_images)，这其中二维数据分别都代表啥，如果用散点图来对这降维后的二维数组进行可视化，横坐标和纵坐标分别代表啥

pca = PCA(n_components=5) pca.fit(Data) Std_pca=pca.transform(Data)

EM算法实现PCA: 探究empca_matlab技术

大家在看

汽车电子通信协议SAE J2284

CST PCB电磁兼容解决方案

Petalinux_config配置信息大全（非常重要）.docx

微信hook(3.9.10.19)

APBS 各版本安装包（linux windows）1.4.2-3.4.0

最新推荐

思科ASA虚拟防火墙 asav-9.19.1-PLR-Licensed

大创的经验分享，希望对你有帮助

Java实现的门面模式及其UML设计图解析

MATLAB多线程编程终极指南：揭秘性能提升10大技巧

请用python制作一个200行左右的商品信息管理系统

韩国风格房地产广告模板赏析

深入Trello API与Notion高级功能：打造定制化信息管理系统

如何在QML中处理异步数据更新以实时显示？

C#编程高效操作与修改Excel文件指南

Notion工作区布局与模板：构建高效团队的两大秘诀

from sklearn.decomposition import PCA def pca_demo(data): transfer = PCA(n_components=0.92) data_new = transfer.fit_transform(data) print(data_new) return data_new if name == 'main': X_new = pca_demo(X_new)注释