import pandas as pd from sklearn.manifold import TSNE import matplotlib.pyplot as plt # 读取数据集 customer = pd.read_csv('customer.csv',encoding='gbk') customer_data = customer.iloc[:,:-1] customer_target = customer.iloc[:,-1] # K-Means类聚 from sklearn.cluster import KMeans kmeans = KMeans(n_clusters=4,random_state=6).fit((customer_data)) # 使用TSNE进行数据降维，降成2维 tsne = TSNE(n_components=2,init='random', random_state=2).fit(customer_data) df = pd.DataFrame(tsne.embedding_) # 提取不同标签的数据 df1 = df[df['labels'] == 0] df2 = df[df['labels'] == 1] df3 = df[df['labels'] == 2] df4 = df[df['labels'] == 3] # 绘制图像 fig = plt.figure(figsize=(9,6)) # 用不同颜色表示不同数据 plt.plot(df1[0],df1[1],'bo',df2[0],df2[1],'r*', df3[0],df1[1],'gD',df4[0],df4[1],'kD') plt.show()这段代码有什么问题

修改下面代码，另画一张可视化图展示出t_sne里面的数据每15行数据个用一种颜色画出。 import pandas as pd from sklearn import cluster from sklearn import metrics import matplotlib.pyplot as plt from sklearn.manifold import TSNE from sklearn.decomposition import PCA def k_means(data_set, output_file, png_file, t_labels, score_file, set_name): model = cluster.KMeans(n_clusters=7, max_iter=1000, init="k-means++") model.fit(data_set) # print(list(model.labels_)) p_labels = list(model.labels_) r = pd.concat([data_set, pd.Series(model.labels_, index=data_set.index)], axis=1) r.columns = list(data_set.columns) + [u'聚类类别'] print(r) # r.to_excel(output_file) with open(score_file, "a") as sf: sf.write("By k-means, the f-m_score of " + set_name + " is: " + str(metrics.fowlkes_mallows_score(t_labels, p_labels))+"\n") sf.write("By k-means, the rand_score of " + set_name + " is: " + str(metrics.adjusted_rand_score(t_labels, p_labels))+"\n") '''pca = PCA(n_components=2) pca.fit(data_set) pca_result = pca.transform(data_set) t_sne = pd.DataFrame(pca_result, index=data_set.index)''' t_sne = TSNE() t_sne.fit(data_set) t_sne = pd.DataFrame(t_sne.embedding_, index=data_set.index) plt.rcParams['font.sans-serif'] = ['SimHei'] plt.rcParams['axes.unicode_minus'] = False dd = t_sne[r[u'聚类类别'] == 0] plt.plot(dd[0], dd[1], 'r.') dd = t_sne[r[u'聚类类别'] == 1] plt.plot(dd[0], dd[1], 'go') dd = t_sne[r[u'聚类类别'] == 2] plt.plot(dd[0], dd[1], 'b') dd = t_sne[r[u'聚类类别'] == 3] plt.plot(dd[0], dd[1], 'o') dd = t_sne[r[u'聚类类别'] == 4] plt.plot(dd[0], dd[1], 'm.') dd = t_sne[r[u'聚类类别'] == 5] plt.plot(dd[0], dd[1], 'co') dd = t_sne[r[u'聚类类别'] == 6] plt.plot(dd[0], dd[1], 'y') plt.savefig(png_file) plt.clf() '''plt.scatter(data_set.iloc[:, 0], data_set.iloc[:, 1], c=model.labels_) plt.savefig(png_file) plt.clf()''' frog_data = pd.read_csv("D:/PyCharmPython/pythonProject/mfcc3.csv") tLabel = [] for family in frog_data['name']: if family == "A": tLabel.append(0) elif family == "B": tLabel.append(1) elif family == "C": tLabel.append(2) elif family == "D": tLabel.append(3) elif family == "E": tLabel.append(4) elif family == "F": tLabel.append(5) elif family == "G": tLabel.append(6) scoreFile = "D:/PyCharmPython/pythonProject/scoreOfClustering.txt" first_set = frog_data.iloc[:, 1:1327] k_means(first_set, "D:/PyCharmPython/pythonProject/kMeansSet_1.xlsx", "D:/PyCharmPython/pythonProject/kMeansSet_2.png", tLabel, scoreFile, "Set_1")

import matplotlib.pyplot as plt from sklearn.manifold import TSNE from sklearn.decomposition import PCA def k_means(data_set, output_file, png_file, t_labels, score_file, set_name): model = cluster...

在下面代码中添加一个可视化图，用来画出r经过t_sne之后前15行数据的图 import pandas as pd from sklearn import cluster from sklearn import metrics import matplotlib.pyplot as plt from sklearn.manifold import TSNE from sklearn.decomposition import PCA def k_means(data_set, output_file, png_file, png_file1, t_labels, score_file, set_name): model = cluster.KMeans(n_clusters=7, max_iter=1000, init="k-means++") model.fit(data_set) # print(list(model.labels_)) p_labels = list(model.labels_) r = pd.concat([data_set, pd.Series(model.labels_, index=data_set.index)], axis=1) r.columns = list(data_set.columns) + [u'聚类类别'] print(r) # r.to_excel(output_file) with open(score_file, "a") as sf: sf.write("By k-means, the f-m_score of " + set_name + " is: " + str(metrics.fowlkes_mallows_score(t_labels, p_labels))+"\n") sf.write("By k-means, the rand_score of " + set_name + " is: " + str(metrics.adjusted_rand_score(t_labels, p_labels))+"\n") '''pca = PCA(n_components=2) pca.fit(data_set) pca_result = pca.transform(data_set) t_sne = pd.DataFrame(pca_result, index=data_set.index)''' t_sne = TSNE() t_sne.fit(data_set) t_sne = pd.DataFrame(t_sne.embedding_, index=data_set.index) plt.rcParams['font.sans-serif'] = ['SimHei'] plt.rcParams['axes.unicode_minus'] = False dd = t_sne[r[u'聚类类别'] == 0] plt.plot(dd[0], dd[1], 'r.') dd = t_sne[r[u'聚类类别'] == 1] plt.plot(dd[0], dd[1], 'go') dd = t_sne[r[u'聚类类别'] == 2] plt.plot(dd[0], dd[1], 'b') dd = t_sne[r[u'聚类类别'] == 3] plt.plot(dd[0], dd[1], 'o') dd = t_sne[r[u'聚类类别'] == 4] plt.plot(dd[0], dd[1], 'm.') dd = t_sne[r[u'聚类类别'] == 5] plt.plot(dd[0], dd[1], 'co') dd = t_sne[r[u'聚类类别'] == 6] plt.plot(dd[0], dd[1], 'y') plt.savefig(png_file) '''plt.scatter(data_set.iloc[:, 0], data_set.iloc[:, 1], c=model.labels_) plt.savefig(png_file) plt.clf()''' frog_data = pd.read_csv("D:/PyCharmPython/pythonProject/mfcc3.csv") tLabel = [] for family in frog_data['name']: if family == "A": tLabel.append(0) elif family == "B": tLabel.append(1) elif family == "C": tLabel.append(2) elif family == "D": tLabel.append(3) elif family == "E": tLabel.append(4) elif family == "F": tLabel.append(5) elif family == "G": tLabel.append(6) scoreFile = "D:/PyCharmPython/pythonProject/scoreOfClustering.txt" first_set = frog_data.iloc[:, 1:1327] k_means(first_set, "D:/PyCharmPython/pythonProject/kMeansSet_1.xlsx", "D:/PyCharmPython/pythonProject/kMeansSet_2.png", "D:/PyCharmPython/pythonProject/kMeansSet_2_1.png", tLabel, scoreFile, "Set_1")

import matplotlib.pyplot as plt from sklearn.manifold import TSNE from sklearn.decomposition import PCA def k_means(data_set, output_file, png_file, png_file1, t_labels, score_file, set_name): model...

给出一段python程序，读取六十维、两万条数据的csv文件，然后使用tsne进行聚类

from sklearn.manifold import TSNE from sklearn.cluster import KMeans # 读取csv文件 data = pd.read_csv('data.csv') # 提取数据 X = data.iloc[:, :60].values # 使用TSNE进行降维，降到2维 tsne = TSNE(n_...

给出一段python程序，读取六十维、两万条带表头数据的csv文件，然后使用tsne进行聚类

from sklearn.manifold import TSNE from sklearn.cluster import KMeans # 读取csv文件 data = pd.read_csv('data.csv', header=0) # 提取数据 X = data.iloc[:, :60].values # 使用TSNE进行降维，降到2维 tsne ...

使用Python实现DBSCAN算法对Iris鸢尾花数据进行聚类的代码，并用tsne画3D图展示聚类结果

import matplotlib.pyplot as plt from mpl_toolkits.mplot3d import Axes3D # 加载数据 iris = pd.read_csv('iris.csv') X = iris.iloc[:, :-1].values # DBSCAN聚类 dbscan = DBSCAN(eps=0.5, min_samples=5) ...

1、使用pandas读取wine.csv，赋给数据框wine_data 2、wine_data中Class列为酒的类别，其余列为酒的相应成分 3、构建K-Means模型，聚集成3个簇 3、使用TSNE进行数据降维，降成2维 3、将原始数据转换为DataFrame，并将聚类结果存储进df数据表 4、提取不同标签的数据 5、设置画布大小为20*12，并使用scatter函数对以上聚类结果进行可视化 6、使用FMI评价法评价建立的K-Means模型，并在聚类数目为1-5时，确定最优聚类数目

from sklearn.manifold import TSNE from sklearn.metrics import fowlkes_mallows_score import matplotlib.pyplot as plt # 读取wine.csv文件，赋给数据框wine_data wine_data = pd.read_csv('wine.csv') # 分离...

那请给出基于密度的聚类法（DBSCAN）版本的上述代码

from sklearn.manifold import TSNE from sklearn.cluster import DBSCAN # 读取csv文件 data = pd.read_csv('data.csv', header=0) # 提取数据 X = data.iloc[:, :60].values # 使用TSNE进行降维，降到2维 tsne ...

生成一个可以在pycharm上可视化的用isomap方法对数据集进行降维分类的代码，随机生成数据集

import matplotlib.pyplot as plt from mpl_toolkits.mplot3d import Axes3D from sklearn.manifold import Isomap from sklearn.neighbors import KNeighborsClassifier from sklearn.model_selection import train...

python中tsne与pca的用法

import matplotlib.pyplot as plt from sklearn.decomposition import PCA from sklearn.manifold import TSNE 接着，我们可以使用Pandas库读取数据： python data = pd.read_csv('data.csv') 接下来...

将csv中的文本数据用word2vec模型转变为向量，再使用k- means聚类

import matplotlib.pyplot as plt from sklearn.manifold import TSNE # 读取 CSV 文件中的文本数据 data = pd.read_csv('data.csv') # 清洗和预处理文本数据 data['text'] = data['text'].apply(lambda x: re.sub...

用代码完成high_diamond_ranked_10min.csv处理和特征工程，首先是写入对应数据信息的探索与分析，进行数据预处理用数据类型转换或编码，按过滤法对数据进行特征选择，挑选出最优特征数，对两类数据用PCA算法降到２维后，进行可视化展示。对完整数据进PCA降维，用碎石图选择合适的降维后特征范围。在一个图中绘制不同特征数对应决策树和随机森林准确率效果折线对比图。分别输出决策树和随机森林总特征数，和对应的准确率、输出特征过滤后的特征数，和对应的准确率、PCA降维后的特征数，和对应的准确率。

import matplotlib.pyplot as plt from sklearn.preprocessing import LabelEncoder, StandardScaler from sklearn.feature_selection import SelectKBest, f_classif from sklearn.decomposition import PCA from ...

16维度特征数据二分类可视化python

from sklearn.manifold import TSNE tsne = TSNE(n_components=2, random_state=0) X_tsne = tsne.fit_transform(data.drop('label', axis=1)) plt.figure() plt.scatter(X_tsne[:, 0], X_tsne[:, 1], c=data['label...

已经安装了numpy、pandas、matplotlib、scikit-learn这些库的基础上，使用k-means算法对鸢尾花数据进行聚类分析 1）导入鸢尾花数据集 2）输出数据的前5行 3）用TSNE进行数据的降维,降维到3维空间中 4）使用肘方法搜索合适的聚类数目，输出肘方法的可视化图 5）使用k-means方法进行聚类 6）输出“每簇包含的样本数量”、“每个簇的聚类中心”和“聚类效果V测度” 7）在3D空间中可视化聚类后的数据空间分布，并可视化聚类中心

import matplotlib.pyplot as plt inertias = [] for k in range(1,11): kmeans = KMeans(n_clusters=k, random_state=42).fit(X) inertias.append(kmeans.inertia_) plt.plot(range(1,11), inertias, 'bo-') plt...

请帮我写python代码，用t-SNE对cifar-10降维，并进行可视化输出

from sklearn.manifold import TSNE import matplotlib.pyplot as plt import pandas as pd import numpy as np from tensorflow.keras.datasets import cifar10 # 加载CIFAR-10数据集 (train_images, train_labels...

AttributeError: 'PCA' object has no attribute 'predict'

import matplotlib.pyplot as plt from sklearn.datasets import fetch_olivetti_faces from sklearn.model_selection import train_test_split, GridSearchCV from sklearn.decomposition import PCA from sklearn....

T-SNE代码解析

from sklearn.manifold import TSNE import matplotlib.pyplot as plt import seaborn as sns import pandas as pd # 读取数据 data = pd.read_csv('data.csv') # 将数据特征列和标签列分开 X = data.iloc[:, :-1]...

相关推荐

pd_split_train_test.rar_pandas_pandas对数据分类_pd.split_split_数据分类

详解pandas库pd.read_excel操作读取excel文件参数整理与实例

pandas.read_csv参数详解(小结)

给出一段python程序，读取六十维、两万条数据的csv文件，然后使用tsne进行聚类

给出一段python程序，读取六十维、两万条带表头数据的csv文件，然后使用tsne进行聚类

使用Python实现DBSCAN算法对Iris鸢尾花数据进行聚类的代码，并用tsne画3D图展示聚类结果

那请给出基于密度的聚类法（DBSCAN）版本的上述代码

生成一个可以在pycharm上可视化的用isomap方法对数据集进行降维分类的代码，随机生成数据集

python中tsne与pca的用法

将csv中的文本数据用word2vec模型转变为向量，再使用k- means聚类

16维度特征数据二分类可视化python

请帮我写python代码，用t-SNE对cifar-10降维，并进行可视化输出

AttributeError: 'PCA' object has no attribute 'predict'

T-SNE代码解析

最新推荐

基于Springboot + Mybatis框架实现的一个简易的商场购物系统.zip

zigbee-cluster-library-specification

管理建模和仿真的文件

实现实时数据湖架构：Kafka与Hive集成

SQL怎么实现 数据透视表

JSBSim Reference Manual

"互动学习：行动中的多样性与论文攻读经历"

实现实时监控告警系统：Kafka与Grafana整合

使用vue3+elementsplus封装一个提示确认框的组件，要求将请求地址和确认框展示信息作为参数暴露出去

c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf

SQL怎么实现数据透视表