读取软科排行榜数据集中各大学的分数(已保存为csv格式),并对其进行排序、去重,并求出和、 累积和、均值、标准差、方差、最小值、最大值。
时间: 2023-10-20 19:24:31 浏览: 91
首先,我们需要导入需要用到的Python库,如下所示:
```python
import pandas as pd
import numpy as np
```
然后,我们可以使用`pandas`库读取csv文件中的数据,并进行去重和排序操作,代码如下所示:
```python
df = pd.read_csv('rank.csv', encoding='gbk') # 读取csv文件
df.drop_duplicates(inplace=True) # 去重
df.sort_values(by='score', inplace=True, ascending=False) # 排序
```
接下来,我们可以使用`numpy`库计算出求和、累积和、均值、标准差、方差、最小值和最大值,代码如下所示:
```python
score = df['score'].values # 取出分数列并转换为numpy数组
# 计算和、累积和、均值、标准差、方差、最小值和最大值
total_score = np.sum(score)
cumulative_score = np.cumsum(score)
mean_score = np.mean(score)
std_score = np.std(score)
var_score = np.var(score)
min_score = np.min(score)
max_score = np.max(score)
```
最后,我们可以将结果打印出来,代码如下所示:
```python
print('总分数:', total_score)
print('累积分数:', cumulative_score)
print('平均分数:', mean_score)
print('标准差:', std_score)
print('方差:', var_score)
print('最低分数:', min_score)
print('最高分数:', max_score)
```
完整代码如下:
阅读全文