将这段代码从matlab转换为python：function [pcs,cprs_data,cprs_c] = pca_compress(data, rerr) x = data; [x,x_mean,x_std] = zscore(x, 0, 1); x = x';

import numpy as np from scipy.stats import zscore def pca_compress(data, rerr): x = data x, x_mean, x_std = zscore(x, axis=0, ddof=1, nan_policy='raise') x = x.T cov_mat = np.cov(x.T) eig_vals, eig_vecs = np.linalg.eig(cov_mat) idx = eig_vals.argsort()[::-1] eig_vals = eig_vals[idx] eig_vecs = eig_vecs[:, idx] var_exp = eig_vals / np.sum(eig_vals) cum_var_exp = np.cumsum(var_exp) n = np.argmax(cum_var_exp >= rerr) + 1 pcs = x.dot(eig_vecs[:, :n]) cprs_data = pcs.dot(eig_vecs[:, :n].T) cprs_c = cprs_data * x_std + x_mean return pcs, cprs_data, cprs_c

python使用PCA和线性回归对附件的数据进行建模。附件的数据来源 http://biostat.mc.vanderbilt.edu/twiki/bin/view/Main/ 请将从pop.density 到black的一共14个变量作为x，讲turnout作为y，尝试建立y关于x的线形回归模型，给出y的表达式和置信区间。（1）使用PCA+线性回归建模；（2）直接使用病态回归模型建模，比较两种方法的结果。1.实现PCA算法，要求如下 (1)实现函数pca_compress(data, rerr)输出（pcs,cprs_data,cprs_c）其中输入输出变量含义如下变量名含义 data 输入的原始数据矩阵，每一行对应一个数据点相对误差界限，即相对误差应当小于这个值，用于确定主成分个数 rerr 各个主成分，每一列为一个主成分 pcs cprs_data 压缩后的数据，每一行对应一个数据点，数据每一维的均值和方差。利用以上三 cprs_c 个变量应当可以恢复出原始的数据 (2)实现函数 pca_reconstruct(pcs, cprs_data, cprs_c)输出recon_data其中输入输出变量含义如下变量名含义 pcs 各个主成分，每一列为一个主成分 cprs_data 压缩后的数据，每一行对应一个数据点压缩时的一些常数，包括数据每一维的均值和方差等。利用以上三 cprs_c 个变量应当可以恢复出原始的数据 recon_data 恢复出来的数据，每一行对应一个数据点

首先，我们需要导入所需的库和数据： ```python import numpy as np import pandas as pd from sklearn.decomposition import PCA from sklearn.linear_model import LinearRegression # 读取数据 data = pd.read_table('http://biostat.mc.vanderbilt.edu/wiki/pub/Main/DataSets/titanic3.txt', sep='\t') X = data.loc[:, 'pop.density':'black'].values y = data['turnout'].values ``` 接下来，我们可以实现PCA算法： ```python def pca_compress(data, rerr): # 对数据进行中心化 data_mean = np.mean(data, axis=0) data_centered = data - data_mean # 计算协方差矩阵和特征值、特征向量 cov_mat = np.cov(data_centered.T) eig_vals, eig_vecs = np.linalg.eig(cov_mat) # 将特征值从大到小排序，并计算累计方差贡献率 eig_vals_sorted = np.sort(eig_vals)[::-1] eig_vecs_sorted = eig_vecs[:, np.argsort(eig_vals)[::-1]] var_exp = np.cumsum(eig_vals_sorted) / np.sum(eig_vals_sorted) # 根据相对误差界限确定主成分个数 n_pcs = np.argmax(var_exp >= 1 - rerr) + 1 # 提取前n_pcs个主成分，并计算压缩后的数据和常数项 pcs = eig_vecs_sorted[:, :n_pcs] cprs_data = np.dot(data_centered, pcs) cprs_c = (data_mean, np.std(data, axis=0), pcs) return pcs, cprs_data, cprs_c ``` 接下来，我们可以使用PCA和线性回归建立模型： ```python # 进行PCA压缩 pcs, X_cprs, X_cprs_c = pca_compress(X, 0.05) # 使用线性回归建立模型 model = LinearRegression() model.fit(X_cprs, y) # 输出模型参数和置信区间 print('y = {:.2f} + {:.2f}*PC1 + {:.2f}*PC2 + {:.2f}*PC3 + {:.2f}*PC4'.format( model.intercept_, model.coef_[0], model.coef_[1], model.coef_[2], model.coef_[3])) print('95% confidence interval: [{:.2f}, {:.2f}]'.format(*np.percentile(model.predict(X_cprs), [2.5, 97.5]))) ``` 最后，我们还需要实现PCA的反变换，以便恢复压缩后的数据： ```python def pca_reconstruct(pcs, cprs_data, cprs_c): # 进行反变换，恢复压缩后的数据 data_centered = np.dot(cprs_data, pcs.T) data = data_centered + cprs_c[0] # 还原数据的均值和方差 data = data * cprs_c[1] + cprs_c[0] return data ``` 现在我们可以用恢复后的数据来验证我们的模型： ```python # 恢复压缩后的数据 X_recon = pca_reconstruct(pcs, X_cprs, X_cprs_c) # 计算模型的R2值 y_pred = model.predict(X_cprs) r2 = 1 - np.sum((y - y_pred) ** 2) / np.sum((y - np.mean(y)) ** 2) print('R2 = {:.2f}'.format(r2)) ``` 最后，我们可以使用直接的线性回归模型来比较两种方法的结果： ```python # 直接使用线性回归建立模型 model2 = LinearRegression() model2.fit(X, y) # 输出模型参数和置信区间 print('y = {:.2f} + {:.2f}*pop.density + {:.2f}*median.age + {:.2f}*median.income + {:.2f}*pct.white + {:.2f}*pct.black'.format( model2.intercept_, model2.coef_[0], model2.coef_[1], model2.coef_[2], model2.coef_[3], model2.coef_[4])) print('95% confidence interval: [{:.2f}, {:.2f}]'.format(*np.percentile(model2.predict(X), [2.5, 97.5]))) # 计算模型的R2值 y_pred2 = model2.predict(X) r22 = 1 - np.sum((y - y_pred2) ** 2) / np.sum((y - np.mean(y)) ** 2) print('R2 = {:.2f}'.format(r22)) ``` 通过比较两种方法的结果，我们可以看到使用PCA和线性回归建立的模型在相对误差界限为0.05的情况下，可以得到较好的拟合结果，且使用的特征数量更少，模型更简洁。而直接使用线性回归建立的模型需要使用更多的特征，且拟合结果的质量较差。

springboot 禁止CPRS

如果您想禁止Spring Boot应用程序的跨站点请求伪造（CSRF）防护，则可以在您的应用程序的配置类中使用以下代码： ```java @Configuration public class SecurityConfig extends WebSecurityConfigurerAdapter { @Override protected void configure(HttpSecurity http) throws Exception { http.csrf().disable(); } } ``` 这将完全禁用Spring Boot应用程序的CSRF防护。但是请注意，这可能会使您的应用程序更易受攻击，因此请确保您已经考虑了其他安全措施。

阅读全文

将这段代码从matlab转换为python：function [pcs,cprs_data,cprs_c] = pca_compress(data, rerr) x = data; [x,x_mean,x_std] = zscore(x, 0, 1); x = x';

springboot 禁止CPRS

相关推荐

CPRS:CodeforcesProblemRecommendedSystem

cloudvista.github.io:VA企业基于云的VistA CPRS

基于FPGA的CPRS混沌加解密芯片算法设计.pdf

2022计算机操作员高级-单项选择_0（精选试题）.doc

com.cprs-fisglobal.common.jar

系统分析--主成分分析作业1

三个月阶段总结分享模板

家庭亲密度和适应性量表中文版(FACES I一CV).doc

无线通信技术在可穿戴计算机中的应用研究.pdf

智慧园区3D可视化解决方案PPT(24页).pptx

labelme标注的json转mask掩码图，用于分割数据集 批量转化，生成cityscapes格式的数据集

（参考GUI）MATLAB GUI漂浮物垃圾分类检测.zip

人脸识别_OpenCV_活体检测_证件照拍照_Demo_1741778955.zip

人脸识别_科大讯飞_Face_签到系统_Swface_1741770704.zip

跟网型逆变器小干扰稳定性分析与控制策略优化simulink仿真模型和代码.zip

16-1文本表示&词嵌入.ipynb

45页-零碳智慧园区标准解决方案：模块化、可扩展且可复制的解决方案.pdf

大家在看

煤矿井下图像型早期火灾探测

PDK安装及cdl文件和gds文件的导入

SAP各模块字段与表的对应关系

蓝牙室内定位服务源码！

Cadence Allegro16.6高级进阶教程

最新推荐

智慧园区3D可视化解决方案PPT(24页).pptx

labelme标注的json转mask掩码图，用于分割数据集 批量转化，生成cityscapes格式的数据集

（参考GUI）MATLAB GUI漂浮物垃圾分类检测.zip

人脸识别_OpenCV_活体检测_证件照拍照_Demo_1741778955.zip

人脸识别_科大讯飞_Face_签到系统_Swface_1741770704.zip

虚拟串口软件：实现IP信号到虚拟串口的转换

【Python进阶篇】：掌握这些高级特性，让你的编程能力飞跃提升

后端调用ragflow api

IE6下实现PNG图片背景透明的技术解决方案

【欧姆龙触摸屏故障诊断全攻略】

labelme标注的json转mask掩码图，用于分割数据集批量转化，生成cityscapes格式的数据集

labelme标注的json转mask掩码图，用于分割数据集批量转化，生成cityscapes格式的数据集