cols_to_norm = ["duration", "src_bytes", "dst_bytes", "wrong_fragment", "urgent", "hot", "num_failed_logins", "num_compromised", "num_root", "num_file_creations", "num_shells", "num_access_files", "count", "srv_count", "serror_rate", "srv_serror_rate", "rerror_rate", "srv_rerror_rate", "same_srv_rate", "diff_srv_rate", "srv_diff_host_rate", "dst_host_count", "dst_host_srv_count", "dst_host_same_srv_rate", "dst_host_diff_srv_rate", "dst_host_same_src_port_rate", "dst_host_srv_diff_host_rate", "dst_host_serror_rate", "dst_host_srv_serror_rate", "dst_host_rerror_rate", "dst_host_srv_rerror_rate"]

时间: 2023-06-26 10:03:15 浏览: 199

这段代码定义了一个列表 `cols_to_norm`，其中包含了需要标准化的特征列名。这些特征列包括了网络安全数据集中的各种特征，如持续时间（duration）、源字节数（src_bytes）、目的字节数（dst_bytes）、错误分段（wrong_fragment）、紧急情况（urgent）等等。这些列需要进行标准化处理，以便进行后续的机器学习模型训练。

risk_factor_df= pd.read_csv("kag_risk_factors_cervical_cancer(1).csv") diagnoses_num_partner_compare_cols = ['Dx:Cancer', 'Dx:HPV', "Number_of_sexual_partners",] corr_matrix = risk_factor_df[diagnoses_num_partner_compare_cols].corr() print(corr_matrix) diagnoses_num_partner_heatmap = px.imshow(corr_matrix, aspect="auto", color_continuous_scale="gnbu", text_auto=True) diagnoses_num_partner_heatmap.show()用pyecharts绘图

以下是使用 Pyecharts 绘制相关系数热力图的示例代码： ``` import pandas as pd from pyecharts import options as opts from pyecharts.charts import HeatMap # 读取数据 risk_factor_df = pd.read_csv("kag_risk_factors_cervical_cancer(1).csv") # 挑选需要绘制相关系数热力图的列 diagnoses_num_partner_compare_cols = ['Dx:Cancer', 'Dx:HPV', "Number_of_sexual_partners"] # 计算相关系数矩阵 corr_matrix = risk_factor_df[diagnoses_num_partner_compare_cols].corr() # 转换成二维列表 corr_list = [] for i in range(corr_matrix.shape[0]): for j in range(corr_matrix.shape[1]): corr_list.append([i, j, corr_matrix.iloc[i, j]]) # 绘制热力图 heatmap = ( HeatMap() .add_xaxis(diagnoses_num_partner_compare_cols) .add_yaxis("", diagnoses_num_partner_compare_cols, corr_list) .set_global_opts( title_opts=opts.TitleOpts(title="Correlation Heatmap"), visualmap_opts=opts.VisualMapOpts( min_=-1, max_=1, is_piecewise=True, pos_top="10%", pos_right="5%" ), tooltip_opts=opts.TooltipOpts(formatter='{c}'), ) ) # 显示图表 heatmap.render_notebook() ``` 其中，我们使用了 Pandas 计算相关系数矩阵，然后将矩阵转换为二维列表，传递给 Pyecharts 的 HeatMap 组件绘制热力图。注意，我们设置了热力图的颜色范围、提示框格式等参数，可以根据需要自行修改。

优化代码 def module_split(self, save_on=True): """ split module data :param save_on: :return: """ for ms in range(self.mod_num): m_sn = self.module_list[ms] module_path = os.path.join(self.result_path_down, m_sn) cols_obj = ChuNengPackMustCols(ms, self.mod_cell_num, self.mod_cell_num) # 传入当前的module序号（如0,1,2,3,4），电芯电压个数，温度NTC个数。 aim_cols = [i for i in cols_obj.total_cols if i in self.df.columns] print(m_sn, aim_cols) self.modules[m_sn] = rename_cols_normal(self.df.loc[:, aim_cols], ms, self.mod_cell_num) print("after change cols name:", ms, m_sn, self.modules[m_sn].columns.tolist()) self.modules[m_sn].dropna(axis=0, how='any', subset=['soc'], inplace=True) volt_col = [f'volt{i}' for i in range(self.mod_cell_num)] temp_col = [f'temp{i}' for i in range(self.mod_cell_num)] self.modules[m_sn].dropna(axis=0, how='any', subset=volt_col, inplace=True) self.modules[m_sn] = stat(self.modules[m_sn], volt_col, temp_col) self.modules[m_sn].reset_index(drop=True, inplace=True) print(self.modules[m_sn]['discharge_ah'].iloc[-1]) self.module_cap[m_sn] = [self.modules[m_sn]['discharge_ah'].iloc[-1], self.modules[m_sn]['charge_ah'].iloc[-1], self.modules[m_sn]['soh'].iloc[-1]] self.module_peaks[m_sn] = list(quick_report(self.modules[m_sn], module_path, f'quick_report_{m_sn[:8]}')) # check soc status mod_soc = self.modules[m_sn]['soc'] self.module_soc_sig[m_sn] = [np.nanmedian(mod_soc), np.max(mod_soc), np.min(mod_soc)] if save_on: single_variables_plot(mod_soc, module_path, f'{m_sn[:8]}_soc_distribution_box.png', 'box', 'SOC') single_variables_plot(mod_soc, module_path, f'{m_sn[:8]}_soc_distribution_violin.png', 'violin', 'SOC')

以下是代码优化后的版本： ``` def module_split(self, save_on=True): """ Split module data :param save_on: :return: """ for ms in range(self.mod_num): m_sn = self.module_list[ms] module_path = os.path.join(self.result_path_down, m_sn) cols_obj = ChuNengPackMustCols(ms, self.mod_cell_num, self.mod_cell_num) aim_cols = [i for i in cols_obj.total_cols if i in self.df.columns] print(m_sn, aim_cols) self.modules[m_sn] = rename_cols_normal(self.df.loc[:, aim_cols], ms, self.mod_cell_num) print("after change cols name:", ms, m_sn, self.modules[m_sn].columns.tolist()) # Drop rows with NaN values in 'soc' and voltage columns volt_col = [f'volt{i}' for i in range(self.mod_cell_num)] temp_col = [f'temp{i}' for i in range(self.mod_cell_num)] self.modules[m_sn].dropna(axis=0, how='any', subset=['soc'] + volt_col, inplace=True) # Compute statistics on remaining data self.modules[m_sn] = stat(self.modules[m_sn], volt_col, temp_col) self.modules[m_sn].reset_index(drop=True, inplace=True) print(self.modules[m_sn]['discharge_ah'].iloc[-1]) self.module_cap[m_sn] = [ self.modules[m_sn]['discharge_ah'].iloc[-1], self.modules[m_sn]['charge_ah'].iloc[-1], self.modules[m_sn]['soh'].iloc[-1] ] self.module_peaks[m_sn] = list(quick_report(self.modules[m_sn], module_path, f'quick_report_{m_sn[:8]}')) # Compute SOC statistics and save plots mod_soc = self.modules[m_sn]['soc'] self.module_soc_sig[m_sn] = [ np.nanmedian(mod_soc), np.max(mod_soc), np.min(mod_soc) ] if save_on: for plot_type in ['box', 'violin']: single_variables_plot(mod_soc, module_path, f'{m_sn[:8]}_soc_distribution_{plot_type}.png', plot_type, 'SOC') ``` 优化后的代码主要做了以下几个方面的改进： 1. 将所有行删除操作合并为一步，同时删除了温度列中的 NaN 值； 2. 统计数据前，只保留了保留了 'soc' 和电压列的非 NaN 行； 3. 在保存 SOC 分布图像时，避免了重复的代码。

阅读全文

相关推荐

pandas read_excel()和to_excel()函数解析

MFC.rar_MFC_MFC opencv_opencv MFC_visual c

LBP.rar_ LBP opencv_ lbp_lbp_opencv LBP_opencv 滑动

drop_mongo_cols.rar

textarea_useto_select.rar_javascript_下拉框

howto_edit_flexgrid_control_TheStudio_vb6_

to_access-pixel-value.zip_access_pixels

megam_rustyprint:一个漂亮的防锈打印机桌。 取一个 [x,y] 的矩阵，标题为 [x] cols 并以简洁的方式打印出来

passing-l-array-to-a-function.rar_多维传递函数_数组、函数

for y in range(rows - offsets): for x in range(cols - offsets): random_num = np.random.randint(0,offsets) dst[y,x] = src[y + random_num,x + random_num]用c语言改写

_dst.create(src.rows-2,src.cols-2,CV_8UC1);

Mat warp_rotate_dst;

大家在看

AllegroENV设置大全.rar

工具类-经度纬度位置处理 以及 距离计算工具类，自用留存

毕业设计C++语言实现基于QT的仿宝石迷阵游戏项目源码.zip

PCIE2.0总线规范，用于PCIE开发参考.zip

3.三星校招真题与面经65页.pdf

最新推荐

Pandas的read_csv函数参数分析详解

python基础教程：Python 中pandas.read_excel详细介绍

2025最新全国水利安全生产知识竞赛题库（含答案）.docx

Fortify代码扫描工具完整用户指南与安装手册

【VS2010-MFC实战秘籍】：串口数据波形显示软件入门及优化全解析

freesurfer完成处理后，如何批量提取每个被试aseg.stats的某个脑区的体积（volume）到一个table中，每个被试的数据是单独的一行

汽车共享使用说明书的开发与应用

BD3201电路维修全攻略：从入门到高级技巧的必备指南

如何在前端使用百度地图同时添加多个标记点？

审计Solidity项目：Turbo 360构建指南

megam_rustyprint:一个漂亮的防锈打印机桌。取一个 [x,y] 的矩阵，标题为 [x] cols 并以简洁的方式打印出来

工具类-经度纬度位置处理以及距离计算工具类，自用留存