from sklearn.decomposition import PCA import numpy as np import matplotlib.pyplot as plt df = pd.get_dummies(df) X = np.array(df) # print(X) pca=PCA(n_components=15)#n_components 选择降维数量 pca.fit(X) # print(pca.transform(X)) X = pca.transform(X) x = np.array(X)[:, 0] y = np.array(X)[:, 1] plt.scatter(x, y, c = y) plt.show()

这是一个使用Python中的sklearn库进行PCA降维并绘制散点图的代码。PCA是一种常用的数据降维方法，它可以将高维数据降至较低维度，同时尽可能地保留原始数据的特征。代码中，首先使用pandas库中的get_dummies函数将数据进行独热编码，然后将其转化为numpy数组。接着，使用sklearn库中的PCA函数进行降维，设置n_components参数为15，表示最终降至15维。最后，将降维后的数据绘制成散点图，其中x、y分别表示第一、第二维的数据，c表示颜色，使用y值来表示。

import streamlit as st import numpy as np import pandas as pd import pickle import matplotlib.pyplot as plt from sklearn import datasets from sklearn.model_selection import train_test_split from sklearn.decomposition import PCA from sklearn.svm import SVC from sklearn.neighbors import KNeighborsClassifier from sklearn.ensemble import RandomForestClassifier import streamlit_echarts as st_echarts from sklearn.metrics import accuracy_score,confusion_matrix,f1_score def pivot_bar(data): option = { "xAxis":{ "type":"category", "data":data.index.tolist() }, "legend":{}, "yAxis":{ "type":"value" }, "series":[ ] }; for i in data.columns: option["series"].append({"data":data[i].tolist(),"name":i,"type":"bar"}) return option st.markdown("mode pracitce") st.sidebar.markdown("mode pracitce") df=pd.read_csv(r"D:\课程数据\old.csv") st.table(df.head()) with st.form("form"): index_val = st.multiselect("choose index",df.columns,["Response"]) agg_fuc = st.selectbox("choose a way",[np.mean,len,np.sum]) submitted1 = st.form_submit_button("Submit") if submitted1: z=df.pivot_table(index=index_val,aggfunc = agg_fuc) st.table(z) st_echarts(pivot_bar(z)) df_copy = df.copy() df_copy.drop(axis=1,columns="Name",inplace=True) df_copy["Response"]=df_copy["Response"].map({"no":0,"yes":1}) df_copy=pd.get_dummies(df_copy,columns=["Gender","Area","Email","Mobile"]) st.table(df_copy.head()) y=df_copy["Response"].values x=df_copy.drop(axis=1,columns="Response").values X_train, X_test, y_train, y_test = train_test_split(x, y, test_size=0.2) with st.form("my_form"): estimators0 = st.slider("estimators",0,100,10) max_depth0 = st.slider("max_depth",1,10,2) submitted = st.form_submit_button("Submit") if "model" not in st.session_state: st.session_state.model = RandomForestClassifier(n_estimators=estimators0,max_depth=max_depth0, random_state=1234) st.session_state.model.fit(X_train, y_train) y_pred = st.session_state.model.predict(X_test) st.table(confusion_matrix(y_test, y_pred)) st.write(f1_score(y_test, y_pred)) if st.button("save model"): pkl_filename = "D:\\pickle_model.pkl" with open(pkl_filename, 'wb') as file: pickle.dump(st.session_state.model, file) 会出什么错误

我没有发现代码中的错误。但是，你需要明确一些内容： 1. 你需要保证数据集的路径正确，并且数据集的格式正确。 2. 如果使用了 `streamlit_echarts` 库，在运行代码前需要先安装该库，可以通过 `!pip install streamlit_echarts` 命令进行安装。 3. 确保所有的依赖项都已经被正确地导入。 4. 确认你的代码没有语法错误和逻辑错误。如果你仍然遇到问题，请提供更详细的错误信息或者异常信息。

阅读全文

相关推荐

import numpy as np import matplotlib.pyplot as plt import math

SVD.rar_SVD_decomposition_svd java_svd...java

PCA.zip_PCA散点图_Python PCA_python pca 画图_python 图_降维

【Day1-AM_CONVERGE数据管理秘籍】：高效处理与分析数据的3大策略

YOLO算法-城市电杆数据集-496张图像带标签-电杆.zip

(177406840)JAVA图书管理系统毕业设计(源代码+论文).rar

(35734838)信号与系统实验一实验报告

YOLO算法-椅子检测故障数据集-300张图像带标签.zip

基于小程序的新冠抗原自测平台小程序源代码（java+小程序+mysql+LW）.zip

YOLO算法-俯视视角草原绵羊检测数据集-4133张图像带标签-羊.zip

(171674830)PYQT5+openCV项目实战：微循环仪图片、视频记录和人工对比软件源码

新建 文本文档.docx

hw06.zip

3. Kafka入门-安装与基本命令

燃气管道施工资质和特种设备安装改造维修委托函.docx

The state of AI 2024.pdf

lab02.zip

Unity视频插件AVPro的Win端2.2.3

建设工程消防验收现场指导意见表.docx

最新推荐

YOLO算法-城市电杆数据集-496张图像带标签-电杆.zip

(177406840)JAVA图书管理系统毕业设计(源代码+论文).rar

(35734838)信号与系统实验一实验报告

YOLO算法-椅子检测故障数据集-300张图像带标签.zip

基于小程序的新冠抗原自测平台小程序源代码（java+小程序+mysql+LW）.zip

Java毕业设计项目：校园二手交易网站开发指南

管理建模和仿真的文件

【MVC标准化：肌电信号处理的终极指南】：提升数据质量的10大关键步骤与工具

能否提供一个在R语言中执行Framingham数据集判别分析的详细和完整的代码示例？

Blaseball Plus插件开发与构建教程

新建文本文档.docx