pandas实现传递熵

传递熵是一种用于分析时间序列数据的方法，可以用来探索两个时间序列之间的信息流动方向。在 Pandas 中，可以使用 `shift()` 函数对时间序列进行滞后处理，然后使用 `corr()` 函数计算两个序列之间的相关性。以下是一个简单的示例代码，演示了如何在 Pandas 中计算传递熵： ```python import pandas as pd import numpy as np # 生成示例数据 data = pd.DataFrame({ 'X': np.random.rand(100), 'Y': np.random.rand(100) }) # 计算 X 到 Y 的传递熵 tau = 1 # 延迟时间 k = 1 # 最大阶数 te_xy = np.zeros(k) for i in range(k): X = data['X'].shift(i) Y = data['Y'] te_xy[i] = (-1) * np.mean(np.log2(np.abs(Y[X.notnull()].values - Y[X.notnull() - tau].values))) print("传递熵（X->Y）：", te_xy) ``` 在这个示例中，我们使用了一个简单的延迟时间和最大阶数，但是你可以根据你的数据调整这些参数。请注意，传递熵计算中使用了对数函数，因此需要确保数据中不包含零值。

优化这段代码import pandas as pd import numpy as np import matplotlib.pyplot as plt #计算信息熵的函数 def calc_ent(x): """ calculate shanno ent of x """ #x.shape[0]计算数组x的元素长度，x长度为x.shape[0]=6 #set() 函数创建一个无序不重复元素集 x_value_list = set([x[i] for i in range(x.shape[0])]) #得到数组x的元素（不包含重复元素），即x_value_list={'c', 'b', 'a'} ent = 0.0 for x_value in x_value_list: p = float(x[x == x_value].shape[0]) / x.shape[0]#计算每个元素出现的概率 logp = np.log2(p) ent -= p * logp print(ent) # 读取Excel文件 df= pd.read_excel("C:\\Users\\a'b'c\\Desktop\\毕设\\图纸数据5.0.xlsx") # 获取Excel文件的列数 num_cols = df.shape[1] weights=[] # 将每一列转换为array形式 for i in range(num_cols): # 获取列名 col_name = df.columns[i] # 将列转换为array形式 col_array = np.array(df[col_name]) #输出每一列的信息熵的值 ent = calc_ent(col_array) #print(col_name, ent) x = i y =ent plt.figure() plt.plot(x, y, linestyle='--', color='blue') plt.xlabel('序号') plt.ylabel('信息熵') plt.show()想要把x轴为序号i，Y轴依次是每个i对应的ent值

你可以将每个i对应的ent值存储到一个数组中，然后将数组作为参数传递给plt.plot()函数，这样就可以在同一个图表中显示所有的信息熵值了。修改后的代码如下： ```python import pandas as pd import numpy as np import matplotlib.pyplot as plt #计算信息熵的函数 def calc_ent(x): """ calculate shanno ent of x """ #x.shape[0]计算数组x的元素长度，x长度为x.shape[0]=6 #set() 函数创建一个无序不重复元素集 x_value_list = set([x[i] for i in range(x.shape[0])]) #得到数组x的元素（不包含重复元素），即x_value_list={'c', 'b', 'a'} ent = 0.0 for x_value in x_value_list: p = float(x[x == x_value].shape[0]) / x.shape[0]#计算每个元素出现的概率 logp = np.log2(p) ent -= p * logp return ent # 读取Excel文件 df= pd.read_excel("C:\\Users\\a'b'c\\Desktop\\毕设\\图纸数据5.0.xlsx") # 获取Excel文件的列数 num_cols = df.shape[1] ent_list = [] # 存储每一列的信息熵值 for i in range(num_cols): # 获取列名 col_name = df.columns[i] # 将列转换为array形式 col_array = np.array(df[col_name]) #输出每一列的信息熵的值 ent = calc_ent(col_array) ent_list.append(ent) # 绘制信息熵的折线图 plt.plot(ent_list, linestyle='--', color='blue') plt.xlabel('序号') plt.ylabel('信息熵') plt.show() ``` 这段代码将每一列的信息熵值存储在ent_list数组中，然后将ent_list作为参数传递给plt.plot()函数，绘制出信息熵的折线图。

阅读全文

pandas实现传递熵

相关推荐

Python 使用Pandas实现数据库的读、写操作 Python源码

Python pandas实现excel工作表合并功能详解

pandas-处理excel工具-python实现

探索Python中连续随机变量的熵估计方法

SMITE：Python模块用于高效计算符号互信息和熵

医疗诊断中的决策树应用：如何实现机器学习的突破

Python机器学习算法实现：从线性回归到神经网络的实战教程

白色大气风格的旅游酒店企业网站模板.zip

python实现用户注册

【图像压缩】基于matlab GUI Haar小波变换图像压缩（含PSNR）【含Matlab源码 9979期】.zip

(177354822)java小鸟游戏.zip

VB+access学生管理系统(论文+系统)(2024am).7z

数学计算中的平方表与圆周率π的应用

VB+SQL光盘信息管理系统(源代码+系统+答辩PPT)(20244m).7z

白色大气风格的健身私人教练模板下载.zip

白色简洁风的商务网站模板下载.zip

白色大气风格的前端设计案例展示模板.zip

圣诞树项目中的硬件和MATLAB实现指南

白色扁平风格的温室大棚公司企业网站源码下载.zip

最新推荐

pandas实现选取特定索引的行

pandas实现将日期转换成timestamp

Python Pandas分组聚合的实现方法

pandas实现excel中的数据透视表和Vlookup函数功能代码

Python使用matplotlib和pandas实现的画图操作【经典示例】

RStudio中集成Connections包以优化数据库连接管理

管理建模和仿真的文件

Keil uVision5全面精通指南

flink提交给yarn19个全量同步MYsqlCDC的作业，flink的配置参数怎样设置

PHP博客旅游的探索之旅