读取软科排行榜数据集中各大学的分数,并对其进行排序、去重,并求出和、累积和、均值、标准差、方差、最小值、最大值。
时间: 2023-10-20 20:26:47 浏览: 93
下面是用 Python 代码实现读取软科排行榜数据集并对其进行排序、去重、统计分数和各种统计量的方法:
```python
import pandas as pd
import numpy as np
# 读取数据集
df = pd.read_csv('rankings.csv')
# 对分数进行排序
df = df.sort_values(by=['score'], ascending=False)
# 去重
df = df.drop_duplicates(subset=['university'])
# 统计分数和
total_score = df['score'].sum()
# 计算累积和
cumulative_score = df['score'].cumsum()
# 计算均值、标准差和方差
mean_score = df['score'].mean()
std_score = df['score'].std()
var_score = df['score'].var()
# 计算最小值和最大值
min_score = df['score'].min()
max_score = df['score'].max()
# 输出结果
print('总分数:', total_score)
print('累积分数:', cumulative_score)
print('均值:', mean_score)
print('标准差:', std_score)
print('方差:', var_score)
print('最小值:', min_score)
print('最大值:', max_score)
```
这里假设数据集的文件名为"rankings.csv",可以根据实际情况进行修改。输出结果将会显示在屏幕上。
阅读全文