np.std()和df.std()的区别在哪

np.std()是numpy库中的方法，用于计算数组的标准差，而df.std()是Pandas库中DataFrame的方法，用于计算DataFrame中每一列的标准差。np.std()只能作用于一维数组，而df.std()可以处理二维数据。另外，np.std()可以设置参数来决定使用总体方差还是样本方差，而df.std()默认使用样本方差。

优化这段代码df_in_grown_ebv = pd.read_table(open(r"C:\Users\荆晓燕\Desktop\20230515分品种计算育种值\生长性能育种值N72分组 (7).txt"), delim_whitespace=True, encoding="gb18030", header=None) df_in_breed_ebv = pd.read_table(open(r"C:\Users\荆晓燕\Desktop\20230515分品种计算育种值\繁殖性能育种值N72分组 (7).txt"), delim_whitespace=True, encoding="gb18030", header=None) # df_in_grown_Phenotype.columns = ['个体号', '活仔EBV', '21d窝重EBV', '断配EBV'] # df_in_breed_Phenotype.columns = ['个体号', '115EBV', '饲料转化率EBV', '瘦肉率EBV', '眼肌EBV', '背膘EBV'] df_in_breed_ebv.columns = ['个体号', '活仔EBV', '21d窝重EBV', '断配EBV'] df_in_grown_ebv.columns = ['个体号', '115daysEBV', '饲料转化率EBV', '瘦肉率EBV', '眼肌EBV', '背膘EBV'] NBA_mean = np.mean(df_in_breed_ebv['活仔EBV']) NBA_std = np.std(df_in_breed_ebv['活仔EBV']) days_mean = np.mean(df_in_grown_ebv['115daysEBV']) days_std = np.std(df_in_grown_ebv['115daysEBV']) fcr_mean = np.mean(df_in_grown_ebv['饲料转化率EBV']) fcr_std = np.std(df_in_grown_ebv['饲料转化率EBV']) output = pd.merge(df_in_grown_ebv, df_in_breed_ebv, how='inner', left_on='个体号', right_on='个体号') # output['计算长白母系指数'] = 0.3 * (NBA - NBA_mean)/NBA_std - 0.3 * (days - days_mean)/days_std - 0.3 * (fcr-fcr_mean)/fcr_std + 0.1 * (pcl-pcl_mean)/pcl_std output['计算长白母系指数'] = 0.29 * (df_in_breed_ebv['活仔EBV'] - NBA_mean)/NBA_std - 0.58 * (df_in_grown_ebv['115daysEBV']- days_mean)/days_std - 0.13 * (df_in_grown_ebv['饲料转化率EBV']-fcr_mean)/fcr_std MLI_mean = np.mean(output['计算长白母系指数']) MLI_std = np.std(output['计算长白母系指数']) output['校正长白母系指数'] = 25 * ((output['计算长白母系指数'] - MLI_mean)/MLI_std) + 100

可以优化的地方有： 1. 重复的路径可以抽象成一个变量，避免代码重复。 2. 可以使用 with 语句来处理文件读取，避免忘记关闭文件。 3. 可以在读取文件时指定列名，避免后续需要重新指定列名。 4. 可以将计算指数和计算校正指数的代码分成两个函数，提高代码的可读性和可维护性。优化后的代码如下： ``` import pandas as pd import numpy as np # 定义文件路径 breed_file = r"C:\Users\荆晓燕\Desktop\20230515分品种计算育种值\繁殖性能育种值N72分组 (7).txt" grown_file = r"C:\Users\荆晓燕\Desktop\20230515分品种计算育种值\生长性能育种值N72分组 (7).txt" def read_file(file_path, columns): with open(file_path, encoding="gb18030") as f: df = pd.read_table(f, delim_whitespace=True, header=None) df.columns = columns return df # 读取文件并指定列名 df_in_breed_ebv = read_file(breed_file, ['个体号', '活仔EBV', '21d窝重EBV', '断配EBV']) df_in_grown_ebv = read_file(grown_file, ['个体号', '115daysEBV', '饲料转化率EBV', '瘦肉率EBV', '眼肌EBV', '背膘EBV']) def calculate_index(df_in_breed_ebv, df_in_grown_ebv): # 计算指数 NBA_mean = np.mean(df_in_breed_ebv['活仔EBV']) NBA_std = np.std(df_in_breed_ebv['活仔EBV']) days_mean = np.mean(df_in_grown_ebv['115daysEBV']) days_std = np.std(df_in_grown_ebv['115daysEBV']) fcr_mean = np.mean(df_in_grown_ebv['饲料转化率EBV']) fcr_std = np.std(df_in_grown_ebv['饲料转化率EBV']) df = pd.merge(df_in_grown_ebv, df_in_breed_ebv, how='inner', on='个体号') df['计算长白母系指数'] = 0.29 * (df['活仔EBV'] - NBA_mean) / NBA_std - 0.58 * (df['115daysEBV'] - days_mean) / days_std - 0.13 * (df['饲料转化率EBV'] - fcr_mean) / fcr_std return df def calculate_correction_index(df): # 计算校正指数 MLI_mean = np.mean(df['计算长白母系指数']) MLI_std = np.std(df['计算长白母系指数']) df['校正长白母系指数'] = 25 * ((df['计算长白母系指数'] - MLI_mean) / MLI_std) + 100 return df # 计算指数和校正指数 df_index = calculate_index(df_in_breed_ebv, df_in_grown_ebv) df_correction_index = calculate_correction_index(df_index) ```

mean = np.mean(data) std = np.std(data) threshold = 3 * std data = data[abs(data - mean) < threshold]如何导入excel数据

可以使用pandas库中的read_excel函数来导入Excel数据。例如，假设我们有一个名为data.xlsx的Excel文件，包含一个名为Sheet1的工作表，其中包含我们要处理的数据。我们可以使用以下代码来导入数据： ``` import pandas as pd # 读取Excel文件 df = pd.read_excel('data.xlsx', sheet_name='Sheet1') # 将数据转换为numpy数组 data = df.to_numpy() # 使用上述代码处理数据 mean = np.mean(data) std = np.std(data) threshold = 3 * std data = data[abs(data - mean) < threshold] ``` 在这个例子中，我们首先使用pandas的read_excel函数读取Excel文件，并将数据存储在一个名为df的DataFrame对象中。然后，我们使用to_numpy函数将DataFrame转换为numpy数组。最后，我们使用上述代码处理数据。

np.std()和df.std()的区别在哪

mean = np.mean(data) std = np.std(data) threshold = 3 * std data = data[abs(data - mean) < threshold]如何导入excel数据

相关推荐

python 标准差计算的实现（std）

Python批量处理行、列和单元格使用到的数据.zip

数据分析中python主要涉及哪些函数和经典算法.docx

def Sta_inf(data): print('_min',np.min(data)) print('_max:',np.max(data)) print('_mean',np.mean(data)) print('_ptp',np.ptp(data)) print('_std',np.std(data)) print('_var',np.var(data)) 1 print('Sta of label:') Sta_inf(Y_data)改为pyspark语句

导入三个csv的三列数据，拼成一列数据，统计不为np.nan数据的95%置信区间

针对PetalLength计算 python求出和、累积和、均值、标准差、方差、最小值、最大值，写出函数表达式与计算结果。 例：np.sum(PetalLength)

导入三个csv的三列数据，拼成一列数据，统计不为np.nan数据的90%置信区间

Xnew = df[['Engine Size (L)', '0-60 MPH Time (seconds)']] y = np.log(df[['Price (in USD)']]) Xnew = sm.add_constant(Xnew) model = sm.OLS(y, Xnew) results = model.fit(cov_type = 'HC3') print(results.summary())

最新推荐

【图像融合】基于matlab深度学习医学图像融合【含Matlab源码 8038期】.md

zlib-1.2.12压缩包解析与技术要点

管理建模和仿真的文件

【Tidy库绘图功能全解析】：打造数据可视化的利器

将字典转换为方形矩阵

微信小程序滑动选项卡源码模版发布

"互动学习：行动中的多样性与论文攻读经历"

【Tidy库与Pandas终极对比】：数据预处理的高效选择？专家深度解读！

driver.add_experimental_option("detach", True)

Unity虚拟人物唇同步插件Oculus Lipsync介绍

针对PetalLength计算 python求出和、累积和、均值、标准差、方差、最小值、最大值，写出函数表达式与计算结果。例：np.sum(PetalLength)