读取软科排行榜数据集中各大学的分数(已保存为csv格式),并对其进行排序、去重,并求出和、 累积和、均值、标准差、方差、最小值、最大值。
时间: 2023-10-20 16:26:48 浏览: 70
好的,首先我们需要使用pandas库来读取csv文件,并对数据进行处理。请确保已经安装了pandas库。
```python
import pandas as pd
# 读取csv文件
data = pd.read_csv('ranking.csv')
# 对分数进行排序并去重
data = data.sort_values(by='score').drop_duplicates()
# 计算和、累积和、均值、标准差、方差、最小值、最大值
total = data['score'].sum()
cumulative_sum = data['score'].cumsum()
average = data['score'].mean()
standard_deviation = data['score'].std()
variance = data['score'].var()
min_value = data['score'].min()
max_value = data['score'].max()
# 输出结果
print('总分数:', total)
print('累积和:', cumulative_sum)
print('均值:', average)
print('标准差:', standard_deviation)
print('方差:', variance)
print('最小值:', min_value)
print('最大值:', max_value)
```
以上代码中,我们首先使用`pd.read_csv()`函数来读取csv文件,将数据保存在`data`变量中。接着,我们使用`sort_values()`函数对分数进行排序,并使用`drop_duplicates()`函数去重。最后,我们分别计算了总分数、累积和、均值、标准差、方差、最小值和最大值,并输出结果。
需要注意的是,以上代码中的`'score'`应该替换成你的数据集中分数所对应的列名。
阅读全文