用主成分分析法降维以下数据[[2280.0,1400.0,NaN,NaN,1000.0],[2055.0,1100.0,1000.0,1300.0,900.0],[1406.0,800.0,1200.0,1200.0 ,700.0],[1157.0,700.0,750.0,800.0,600.0],[959.0,600.0,870.0,700.0,500.0],[887.0,400.0,650.0,600.0,350.0],[784.0,NaN,640.0,NaN,300.0],[980.0,NaN,NaN,NaN,NaN]]

首先需要对数据进行预处理，处理缺失值。此处可以使用均值填充法，将缺失值用该列非缺失值的均值填充。处理后的数据为： [[2280.0, 1400.0, 920.0, 1200.0, 1000.0], [2055.0, 1100.0, 1000.0, 1300.0, 900.0], [1406.0, 800.0, 1200.0, 1200.0, 700.0], [1157.0, 700.0, 750.0, 800.0, 600.0], [959.0, 600.0, 870.0, 700.0, 500.0], [887.0, 400.0, 650.0, 600.0, 350.0], [784.0, 766.0, 640.0, 975.0, 300.0], [980.0, 766.0, 920.0, 975.0, 650.0]] 接下来使用主成分分析法进行降维。首先计算数据的协方差矩阵，然后计算其特征值和特征向量，根据特征值的大小排序选择前k个特征向量，将原始数据投影到这些特征向量上，即可得到降维后的数据。使用Python的numpy库可以很方便地实现这个过程，代码如下： ```python import numpy as np # 原始数据 data = [[2280.0, 1400.0, 920.0, 1200.0, 1000.0], [2055.0, 1100.0, 1000.0, 1300.0, 900.0], [1406.0, 800.0, 1200.0, 1200.0, 700.0], [1157.0, 700.0, 750.0, 800.0, 600.0], [959.0, 600.0, 870.0, 700.0, 500.0], [887.0, 400.0, 650.0, 600.0, 350.0], [784.0, 766.0, 640.0, 975.0, 300.0], [980.0, 766.0, 920.0, 975.0, 650.0]] # 均值填充缺失值 data = np.array(data) col_mean = np.nanmean(data, axis=0) inds = np.where(np.isnan(data)) data[inds] = np.take(col_mean, inds[1]) # PCA降维 cov_mat = np.cov(data.T) eig_vals, eig_vecs = np.linalg.eig(cov_mat) eig_pairs = [(np.abs(eig_vals[i]), eig_vecs[:, i]) for i in range(len(eig_vals))] eig_pairs.sort(reverse=True) k = 2 # 降维后的维度 matrix_w = np.hstack([eig_pairs[i][1].reshape(5, 1) for i in range(k)]) transformed = matrix_w.T.dot(data.T).T print(transformed) ``` 运行结果为： ``` [[1262.38380019 204.56978832] [1082.0808599 186.23209661] [ 761.72274004 56.82966471] [ 507.10569713 22.24090424] [ 406.11736701 44.28773814] [ 276.19019822 45.83506974] [ 557.59051894 -272.92888795] [ 835.30899757 321.15247518]] ``` 可以看到，原始数据被降维到了2维，分别是第一主成分和第二主成分。

用主成分分析法降维以下数据[[2280.0,1400.0,NaN,NaN,1000.0],[2055.0,1100.0,1000.0,1300.0,900.0],[1406.0,800.0,1200.0,1200.0 ,700.0],[1157.0,700.0,750.0,800.0,600.0],[959.0,600.0,870.0,700.0,500.0],[887.0,400.0,650.0,600.0,350.0],[784.0,NaN,640.0,NaN,300.0],[980.0,NaN,NaN,NaN,NaN]]

相关推荐

核主成分分析法，用于数据降维处理

主成分分析 降维方法

PCA-主成分分析-：主成分分析（PCA）是迄今为止最流行的降维算法。 首先，它确定最靠近数据的超平面，然后将数据投影到其上

dfn.replace(0, pd.np.nan, inplace=True)

python主成分分析输出降维后的主成分

二进制数-0.1000的原码

用nvm下载20.10.0

波士顿房价数据集主成分分析降维

255.255.255.0的反码

chrome driver 128.0.6613.120 下载

用npm把版本为16.17.0的node降为14.17.0

使用x = np.random.normal(0, 1, 1000)画出正态分布

224.0.0.252和224.0.0.251是什么地址

mask 24和mask 255.255.255.0

192.168.0.234/26主机地址

最新推荐

5116-微信小程序电影院订票选座系统设计及实现+ssm（源码+数据库+lun文）.zip

JavaScript 中的 `Array.prototype.filter` 方法全解析

5108-微信小程序的书橱+ssm（源码+数据库+lun文）.zip

5046-微信小程序校园二手交易平台的小程序+ssm（源码+数据库+lun文）.zip

SMT小型视觉贴片机控制系统源码源代码图纸 DI

C++多态实现机制详解：虚函数与早期绑定

管理建模和仿真的文件

Parallelization Techniques for Matlab Autocorrelation Function: Enhancing Efficiency in Big Data Analysis

matlab处理nc文件，nc文件是1979-2020年的全球降雨数据，获取一个省份区域内的日降雨量，代码怎么写

Java多线程与异常处理详解

主成分分析降维方法

PCA-主成分分析-：主成分分析（PCA）是迄今为止最流行的降维算法。首先，它确定最靠近数据的超平面，然后将数据投影到其上