读取软科排行榜数据集中各大学的分数(已保存为csv格式),并对其进行排序、去重,并求出和、 累积和、均值、标准差、方差、最小值、最大值。
时间: 2023-10-20 07:05:37 浏览: 118
首先,我们需要安装 pandas 库来进行数据处理。可以使用以下命令来安装:
```
pip install pandas
```
然后,我们可以使用 pandas 库来读取 csv 格式的数据集,并对其进行排序、去重等操作。下面是代码示例:
```python
import pandas as pd
# 读取数据集
data = pd.read_csv('ranking.csv')
# 对分数进行排序
data = data.sort_values('score', ascending=False)
# 去除重复项
data = data.drop_duplicates(subset=['university'])
# 计算和、累积和、均值、标准差、方差、最小值、最大值
total = data['score'].sum()
cumulative_sum = data['score'].cumsum()
mean = data['score'].mean()
std = data['score'].std()
var = data['score'].var()
min_score = data['score'].min()
max_score = data['score'].max()
# 输出结果
print('总分数:', total)
print('累积和:', cumulative_sum)
print('均值:', mean)
print('标准差:', std)
print('方差:', var)
print('最小值:', min_score)
print('最大值:', max_score)
```
其中,`ranking.csv` 文件是软科排行榜数据集保存为 csv 格式的文件名,需要根据实际情况进行修改。执行以上代码后,即可得到各大学的分数排序、去重以及各统计指标的结果。
阅读全文