数据框的简单处理 1)生成如下所示的数据框 df1,其中,年龄是 [ 18 , 25 ] 之间的随机整数,各科成绩是 [ 60 , 100 ] 之间的随机整数。 2)新添加一列数据,保存各个学生的“管理学”的成绩,具体成绩仍是 [ 60 , 100 ] 之间的随机整数。 3)对上述更新后的数据框进行排序,首先按照‘Python程序设计’成绩从高到低排序,若该门成绩相同,则按照“高数”从高到低排序。排序结果赋值给df2. 4) 在df2的基础上,将列“高数”重命名为“微积分”,并调整列的展示顺序为:"Python程序设计"、“微积分”、“概率论”、“管理学”。结果赋值给df3 5) 按照“班级”进行分组,并计算每个班级的各科成绩的平均分,重新设置表的索引为0开始的数字编号,结果赋值给df4。如下图所示: 6)将df4的内容转成json格式的字符串,赋值给变量df4_json. 7)将df4_json的内容写入到json文件中,文件命名为df4.json. tips: 参考案例分析,通过reset_index()进行重置索引。
时间: 2024-02-24 16:56:44 浏览: 48
下面是代码实现:
```python
import pandas as pd
import numpy as np
# 生成数据框df1
np.random.seed(1)
df1 = pd.DataFrame({
'学号': range(1, 11),
'班级': ['A', 'A', 'A', 'B', 'B', 'B', 'C', 'C', 'C', 'C'],
'年龄': np.random.randint(18, 26, size=10),
'Python程序设计': np.random.randint(60, 101, size=10),
'高数': np.random.randint(60, 101, size=10),
'概率论': np.random.randint(60, 101, size=10)
})
# 添加“管理学”列
df1['管理学'] = np.random.randint(60, 101, size=10)
# 按照要求排序
df2 = df1.sort_values(by=['Python程序设计', '高数'], ascending=[False, False])
# 重命名“高数”列为“微积分”,调整列的展示顺序
df3 = df2.rename(columns={'高数': '微积分'})[['Python程序设计', '微积分', '概率论', '管理学']]
# 按照班级进行分组,计算各科成绩的平均分
df4 = df3.groupby('班级').mean().reset_index().reset_index(drop=True)
# 将df4转换成json格式字符串
df4_json = df4.to_json(orient='records')
# 将df4_json写入到json文件中
with open('df4.json', 'w') as f:
f.write(df4_json)
```
阅读全文