1）生成如下所示的数据框 df1，其中，年龄是 [ 18 , 25 ] 之间的随机整数，各科成绩是 [ 60 , 100 ] 之间的随机整数。 2）新添加一列数据，保存各个学生的“管理学”的成绩，具体成绩仍是 [ 60 , 100 ] 之间的随机整数。 3）对上述更新后的数据框进行排序，首先按照‘Python程序设计’成绩从高到低排序，若该门成绩相同，则按照“高数”从高到低排序。排序结果赋值给df2. 在df2的基础上，将列“高数”重命名为“微积分”，并调整列的展示顺序为："Python程序设计"、“微积分”、“概率论”、“管理学”。结果赋值给df3 按照“班级”进行分组，并计算每个班级的各科成绩的平均分，重新设置表的索引为0开始的数字编号，结果赋值给df4。如下图所示： 6）将df4的内容转成json格式的字符串，赋值给变量df4_json. 7）将df4_json的内容写入到json文件中，文件命名为df4.json. tips：参考案例分析，通过reset_index()进行重置索引。

时间: 2024-02-23 12:59:56 浏览: 119

好的，我来为您解答这个问题。请稍等片刻，我会逐步生成相应的数据框和结果。 1）生成数据框 df1： ```python import pandas as pd import numpy as np np.random.seed(2021) df1 = pd.DataFrame({ '学号': ['A001', 'A002', 'A003', 'A004', 'A005', 'A006'], '班级': ['Class_1']*3 + ['Class_2']*3, '年龄': np.random.randint(18, 26, size=6), 'Python程序设计': np.random.randint(60, 101, size=6), '高数': np.random.randint(60, 101, size=6), '概率论': np.random.randint(60, 101, size=6) }) df1 ``` 输出结果如下： ``` 学号班级年龄 Python程序设计高数概率论 0 A001 Class_1 22 76 83 73 1 A002 Class_1 19 94 87 67 2 A003 Class_1 24 67 99 72 3 A004 Class_2 20 82 71 92 4 A005 Class_2 25 72 63 66 5 A006 Class_2 23 63 61 60 ``` 2）添加“管理学”的成绩： ```python df1['管理学'] = np.random.randint(60, 101, size=6) df1 ``` 输出结果如下： ``` 学号班级年龄 Python程序设计高数概率论管理学 0 A001 Class_1 22 76 83 73 80 1 A002 Class_1 19 94 87 67 87 2 A003 Class_1 24 67 99 72 81 3 A004 Class_2 20 82 71 92 73 4 A005 Class_2 25 72 63 66 93 5 A006 Class_2 23 63 61 60 77 ``` 3）排序： ```python df2 = df1.sort_values(['Python程序设计', '高数'], ascending=[False, False]) df2 ``` 输出结果如下： ``` 学号班级年龄 Python程序设计高数概率论管理学 1 A002 Class_1 19 94 87 67 87 3 A004 Class_2 20 82 71 92 73 0 A001 Class_1 22 76 83 73 80 4 A005 Class_2 25 72 63 66 93 2 A003 Class_1 24 67 99 72 81 5 A006 Class_2 23 63 61 60 77 ``` 重命名列名和重新排列列的顺序： ```python df3 = df2.rename(columns={'高数': '微积分'})[['Python程序设计', '微积分', '概率论', '管理学']] df3 ``` 输出结果如下： ``` Python程序设计微积分概率论管理学 1 94 87 67 87 3 82 71 92 73 0 76 83 73 80 4 72 63 66 93 2 67 99 72 81 5 63 61 60 77 ``` 按照班级进行分组，并计算每个班级的各科成绩的平均分，重新设置表的索引为0开始的数字编号： ```python df4 = df1.groupby('班级').mean().reset_index().drop(columns=['年龄']) df4.index = range(len(df4)) df4 ``` 输出结果如下： ``` 班级 Python程序设计高数概率论管理学 0 Class_1 79.000000 89.666667 70.666667 82.666667 1 Class_2 72.333333 65.000000 72.666667 81.000000 ``` 将 df4 的内容转成 json 格式的字符串： ```python df4_json = df4.to_json(orient='records') df4_json ``` 输出结果如下： ``` '[{"班级":"Class_1","Python程序设计":79.0,"高数":89.6666666667,"概率论":70.6666666667,"管理学":82.6666666667},{"班级":"Class_2","Python程序设计":72.3333333333,"高数":65.0,"概率论":72.6666666667,"管理学":81.0}]' ``` 将 df4_json 的内容写入到 json 文件中，文件命名为 df4.json： ```python with open('df4.json', 'w') as f: f.write(df4_json) ``` 至此，问题得到了完整的解答。

阅读全文

相关推荐

DF1通信协议说明

DF1协议手册，英文版.pdf

DF1比较数据.zip

生成两个dataframe数据，df1和df2，df1列名：‘Name’，‘Age’，‘Gender’，行数：5行，数据：随机名字、年龄和性别数据

用python 创建10*10的数据框命名为df1，值为-10到10的随机整数，自定义行、列名。将数据以csv格式保存在当前目录下

R语言，将数据框df1_data和df2_data合并到data里

构建3个dataframe，分别命名为df1、df2和df3，均为7行5列，数值为-10至10之间的随机整数，其中每个dataframe当中都有4个数是空值

选取合适的方法将数据框df1_data和df2_data合并到data里

数据框df1和df2，列索引都是level、entity1和entity2，若df1的entity1列能在df2的entity1列找到，则df1的level列都加上df2对应的entity1的level值，若在df2的entity2列找到，则加上df2对应的entity2的level值再加上1

用python构建一个10*10的dataframe，记作df1，数值是0至100的随机整数。构建一个新的dataframe，记为df2，df2每行的数值是df1每行数值中大于该行中位数的部分

用python构建一个10*10的dataframe，记作df1，数值是0至100的随机整数。令第五行第四列的数值变为空值

重建索引为['赵一','钱二','孙三','李四','周五','钱多多']来创建新的数据框df1，补充钱多多的score1和address为60、厦门

R语言中，数据框df1_data按照季度进行分组，对第二列、第三列、第四列的数据求和，用aggregate写出来

假设你有两个Pandas数据框df1和df2，它们的长度不同。你想要从它们的最后一个数据开始进行对齐，并将它们进行横向拼接

2015-2024软考中级信息安全工程师视频教程网课程真题库课件复习材料.zip

智慧城市安防-YOLOv11夜间低光环境下的异常行为检测实战.pdf

农业智能化革命-YOLOv11实现多作物叶片实时分割与表型分析.pdf

大家在看

AGV硬件设计概述.pptx

DSR.rar_MANET DSR_dsr_dsr manet_it_manet

VITA 62.0.docx

年终活动抽奖程序，随机动画变化

形成停止条件-c#导出pdf格式

最新推荐

2015-2024软考中级信息安全工程师视频教程网课程真题库课件复习材料.zip

Spring Websocket快速实现与SSMTest实战应用

电力电子技术的智能化：数据中心的智能电源管理

通过spark sql读取关系型数据库mysql中的数据

新版微软inspect工具下载：32位与64位版本

如何运用电力电子技术实现IT设备的能耗监控

2635.656845多位小数数字，js不使用四舍五入保留两位小数，然后把结果千分位，想要的结果是2,635.65;如何处理

解决最小倍数问题 - Ruby编程项目欧拉实践

电力电子技术：IT数据中心的能源革命者

设计一个程序，实现哈希表的相关运算：用Java语言编写