首页读取软科排行榜数据集中各大学的分数(已保存为csv格式),并对其进行排序、去重,并求出和、累积和、均值、标准差、方差、最小值、最大值。

读取软科排行榜数据集中各大学的分数(已保存为csv格式),并对其进行排序、去重,并求出和、累积和、均值、标准差、方差、最小值、最大值。

时间: 2023-10-20 18:05:37 浏览: 121

首先，我们需要安装 pandas 库来进行数据处理。可以使用以下命令来安装： ``` pip install pandas ``` 然后，我们可以使用 pandas 库来读取 csv 格式的数据集，并对其进行排序、去重等操作。下面是代码示例： ```python import pandas as pd # 读取数据集 data = pd.read_csv('ranking.csv') # 对分数进行排序 data = data.sort_values('score', ascending=False) # 去除重复项 data = data.drop_duplicates(subset=['university']) # 计算和、累积和、均值、标准差、方差、最小值、最大值 total = data['score'].sum() cumulative_sum = data['score'].cumsum() mean = data['score'].mean() std = data['score'].std() var = data['score'].var() min_score = data['score'].min() max_score = data['score'].max() # 输出结果 print('总分数：', total) print('累积和：', cumulative_sum) print('均值：', mean) print('标准差：', std) print('方差：', var) print('最小值：', min_score) print('最大值：', max_score) ``` 其中，`ranking.csv` 文件是软科排行榜数据集保存为 csv 格式的文件名，需要根据实际情况进行修改。执行以上代码后，即可得到各大学的分数排序、去重以及各统计指标的结果。

阅读全文