import pandas as pd import networkx as nx # 读取数据 data = pd.read_excel('附件1.xlsx') # 构建有向图 G = nx.DiGraph() for _, row in data.iterrows(): source = row['发货城市'] target = row['收货城市'] weight = row['快递数量'] if not G.has_edge(source, target): G.add_edge(source, target, weight=weight) else: G[source][target]['weight'] += weight # 计算节点的入度和出度 in_degree = dict(G.in_degree(weight='weight')) out_degree = dict(G.out_degree(weight='weight')) # 归一化处理 total_in = sum(in_degree.values()) total_out = sum(out_degree.values()) for node in G.nodes(): if total_in > 0: in_degree[node] /= total_in if total_out > 0: out_degree[node] /= total_out # 计算 PageRank 值 pr = nx.pagerank(G, weight='weight') # 排序输出结果 result = sorted(pr.items(), key=lambda x: x[1], reverse=True)[:5] for i, (node, score) in enumerate(result): print(f'{i+1}. {node} ({score:.4f})')

时间: 2024-03-29 09:36:43 浏览: 81

这段代码是使用 Python 的 pandas 和 networkx 库读取 Excel 中的数据，构建有向图，并进行 PageRank 计算，最后输出 PageRank 值最高的前五个节点。具体步骤如下： 1. 读取 Excel 中的数据，存储在一个 pandas 的 DataFrame 中。 2. 构建有向图，使用 DiGraph() 函数创建一个有向图对象 G。 3. 遍历 DataFrame 中的每一行数据，将发货城市和收货城市作为有向图中的节点，将快递数量作为边的权重。 4. 如果有向图中不存在该边，则添加该边并设置权重为当前的快递数量；否则，将该边的权重加上当前的快递数量。 5. 计算每个节点的入度和出度，使用 in_degree() 和 out_degree() 函数分别计算每个节点的入度和出度，并将权重归一化处理。 6. 计算 PageRank 值，使用 pagerank() 函数计算有向图中每个节点的 PageRank 值，并将权重设置为边的权重。 7. 排序输出结果，使用 sorted() 函数对 PageRank 值进行排序，并输出 PageRank 值最高的前五个节点及其对应的值。总的来说，这段代码可以用于分析快递运输网络中的节点重要性，找出最重要的节点，以便进行优化和改进。

import pandas as pd import numpy as np import networkx as nx # 读取Excel文件中的邻接矩阵 adjacency_matrix = pd.read_excel('output.xlsx', index_col=0) # 将邻接矩阵转换为numpy数组 adjacency_matrix = adjacency_matrix.to_numpy() # 创建有向图对象 G = nx.DiGraph(adjacency_matrix) def preprocess(G): p = 0 directedGraph = nx.DiGraph() for u in G.nodes(): for v in G.neighbors(u): if (v != u): # propProb = G.number_of_edges(u, v) / G.in_degree(v) propProb = G.number_of_edges(u, v) / G.degree(v) directedGraph.add_edge(u, v, pp=propProb) # p += propProb # print(propProb) # print('平均阈值：', p/2939) return directedGraph def simulate(G, seedNode, propProbability): newActive = True currentActiveNodes = copy.deepcopy(seedNode) newActiveNodes = set() activatedNodes = copy.deepcopy(seedNode) # Biar ga keaktivasi 2 kali influenceSpread = len(seedNode) while (newActive): for node in currentActiveNodes: for neighbor in G.neighbors( node): # Harus dicek udah aktif apa belom, jangan sampe ngaktifin yang udah aktif if (neighbor not in activatedNodes): if (G[node][neighbor]['pp'] > propProbability): # flipCoin(propProbability) newActiveNodes.add(neighbor) activatedNodes.append(neighbor) influenceSpread += len(newActiveNodes) if newActiveNodes: currentActiveNodes = list(newActiveNodes) newActiveNodes = set() else: newActive = False # print("activatedNodes",len(activatedNodes),activatedNodes) return influenceSpread def flipCoin(probability): return random.random() < probability解释一下这个代码

这代码是一个传播模型的实现，用于模拟信息在一个有向图中的传播过程。首先，它读取一个Excel文件，其中包含了一个邻接矩阵，表示图中节点之间的连接关系。然后，将邻接矩阵转换为numpy数组，并创建一个有向图对象。 preprocess函数用于预处理图对象，它遍历所有节点，并计算每条边的传播概率（propProbability），然后将这些边添加到有向图中。 simulate函数用于模拟信息的传播过程。它接受一个种子节点（seedNode）和传播概率（propProbability）作为输入。通过迭代算法，不断将新激活的节点加入到currentActiveNodes集合中，并计算影响范围（influenceSpread）。直到没有新激活的节点时，传播过程结束。最后，flipCoin函数用于模拟抛硬币的过程，以给定的概率返回True或False。在simulate函数中，它用于判断节点是否被激活。总体上，这段代码实现了一个简单的信息传播模型，并可以根据传播概率和种子节点模拟信息在有向图中的传播过程。

import pandas as pd import numpy as np import networkx as nx import matplotlib.pyplot as plt # 读取Excel文件中的邻接矩阵 adjacency_matrix = pd.read_excel('output.xlsx', index_col=0) # 将邻接矩阵转换为numpy数组 adjacency_matrix = adjacency_matrix.to_numpy() # 创建有向图对象 G = nx.DiGraph(adjacency_matrix) def preprocess(G): p = 0 directedGraph = nx.DiGraph() for u in G.nodes(): for v in G.neighbors(u): if (v != u): propProb = G.number_of_edges(u, v) / G.degree(v) directedGraph.add_edge(u, v, pp=propProb) return directedGraph def simulate(G, seedNode, propProbability): newActive = True currentActiveNodes = seedNode.copy() newActiveNodes = set() activatedNodes = seedNode.copy() influenceSpread = len(seedNode) while newActive: for node in currentActiveNodes: for neighbor in G.neighbors(node): if neighbor not in activatedNodes: if G[node][neighbor]['pp'] > propProbability: newActiveNodes.add(neighbor) activatedNodes.append(neighbor) influenceSpread += len(newActiveNodes) if newActiveNodes: currentActiveNodes = list(newActiveNodes) newActiveNodes = set() else: newActive = False return influenceSpread def flipCoin(probability): return np.random.random() < probability # 可视化传播过程 def visualizePropagation(G, seedNode, propProbability): pos = nx.spring_layout(G) # 选择布局算法 labels = {node: node for node in G.nodes()} # 节点标签为节点名 colors = ['r' if node in seedNode else 'b' for node in G.nodes()] # 种子节点为红色，其他节点为蓝色 plt.figure(figsize=(10,6)) nx.draw_networkx_nodes(G, pos, node_color=colors) nx.draw_networkx_edges(G, pos) nx.draw_networkx_labels(G, pos, labels) plt.title('Propagation Visualization') plt.show() # 示例用法 seedNode = [7,36,17] propProbability = 0.7 directedGraph = preprocess(G) influenceSpread = simulate(directedGraph, seedNode, propProbability) print("Influence Spread:", influenceSpread) visualizePropagation(directedGraph, seedNode, propProbability)修改这个代码使得输出图形节点之间间隔合理能够看清

你可以尝试修改`nx.spring_layout()`函数的参数，例如`k`，来调整节点之间的距离。这个参数控制着节点之间的斥力大小，较大的`k`值会使节点之间的距离增大，从而使得图形更容易观察。下面是修改后的代码示例： ```python # 可视化传播过程 def visualizePropagation(G, seedNode, propProbability): pos = nx.spring_layout(G, k=0.5) # 调整k值来改变节点之间的距离 labels = {node: node for node in G.nodes()} # 节点标签为节点名 colors = ['r' if node in seedNode else 'b' for node in G.nodes()] # 种子节点为红色，其他节点为蓝色 plt.figure(figsize=(10,6)) nx.draw_networkx_nodes(G, pos, node_color=colors) nx.draw_networkx_edges(G, pos) nx.draw_networkx_labels(G, pos, labels) plt.title('Propagation Visualization') plt.show() # 示例用法 seedNode = [7,36,17] propProbability = 0.7 directedGraph = preprocess(G) influenceSpread = simulate(directedGraph, seedNode, propProbability) print("Influence Spread:", influenceSpread) visualizePropagation(directedGraph, seedNode, propProbability) ``` 通过调整`k`值，你可以改变节点之间的距离，使得图形更易于观察。可以尝试不同的值来达到最合适的效果。

阅读全文

相关推荐

Pandas读取Excel参数详解：pd.read_excel操作与实践

使用pandas读取Excel：pd.read_excel全面解析与参数实例

详解pandas pd.read_excel：Excel文件读取参数与实例整合

Python 数据分析中的数据结构与算法

python读取excel文件并使用networkx构建网络

用networkx从excel表格中导入有向图

python怎么从excel导入两列字符数据并使用此两列数据画有向图

Python中怎么从excel导入数据，使之成为有向图的权重

Python读取Excel表中的数据并绘制成社交网络图

把一个有向图的邻接矩阵（放在excel中）导入python，基于这个拓扑结构计算入度出度，度中心度

读取excel文件，对网点的重要性进行排序的程序python

用python语言实现：网络包括24个顶点、76条边，各条边的编号、尾节点、头节点、长度、容量已在excel表中给出，请计算所有顶点对之间的最短路长度，并绘制该网络的有向图。

python将两列excel网络数据转换成网络加权邻接矩阵

python根据excel表格绘制网络图

复杂网络pycharmexcel读取

从左到右一共120个站点，excel中列数和行数的数值均代表站点位置，其中的数值代表行数代表的站点到列数代表站点的距离，给出连接图的代码

大家在看

TPS54160实现24V转正负15V双输出电源AD设计全方案

节的一些关于非传统-华为hcnp-数通题库2020/1/16（h12-221）v2.5

深圳大学《数据结构》1-4章练习题

【电子版】校招面试题库（附答案与解析）java篇-破解密码.pdf

ICCV2019无人机集群人体动作捕捉文章

最新推荐

基于微信小程序的社区门诊管理系统php.zip

白色大气风格的设计师作品模板下载.zip

工程经济学自考必备软件下载

UML课程设计报告.doc

RStudio中集成Connections包以优化数据库连接管理

管理建模和仿真的文件

Keil uVision5全面精通指南

flink提交给yarn19个全量同步MYsqlCDC的作业，flink的配置参数怎样设置

PHP博客旅游的探索之旅

"互动学习：行动中的多样性与论文攻读经历"