def count_matrix(matrix, array_data): for row in range(1, len(matrix)): # 从下标1开始遍历矩阵的行元素 for col in range(1, len(matrix)): # 从下标1开始遍历矩阵列元素 if matrix[0][row] == matrix[col][0]: # 取出的行关键词和列关键词相同,则其对应的共现次数为0,即矩阵对角线为0 matrix[col][row] = 0 else: counter = 0 # 初始化计数器 for ech in array_data: # 遍历格式化后的原始数据,让取出的行关键词和取出的列关键词进行组合, # 再放到每条原始数据中查询 if matrix[0][row] in ech and matrix[col][0] in ech: counter += 1 else: continue matrix[col][row] = counter return matrix NXdata = pd.DataFrame(count_matrix(University_matrix, University_array)) print(NXdata)
时间: 2024-02-10 18:28:10 浏览: 51
import turtle import time def LittleHeart(): for i in range(
这段代码看起来是用来计算共现矩阵的。共现矩阵是用来记录两个关键词在一组数据中同时出现的次数。代码中的`matrix`是一个二维数组,表示矩阵,`array_data`是一个包含原始数据的数组。
在代码中,通过两个嵌套的循环遍历矩阵的每一个元素。如果当前遍历到的行关键词和列关键词相同,那么将对应的共现次数设置为0,表示在同一个关键词下不会共现。否则,通过遍历格式化后的原始数据,判断行关键词和列关键词是否同时出现在某条原始数据中,如果是,则将计数器加1,最后将计数器的值赋给对应位置的矩阵元素。
最后将更新后的矩阵转换为DataFrame,并打印输出。
注意,这段代码缺少一些必要的定义和导入语句,可能无法直接运行。
阅读全文