import pandas as pd data1=pd.DataFrame({ '年级':['大一','大二','大三','大四','大二','大三','大一','大三','大四'], '姓名':['李宏卓','李四真','张振海','赵飞鸿','白蓉','马腾飞','张艺凡','金子轩','今夜'], '年龄':['18','19','20','21','19','20','18','20','21'], '性别':['男','女','男','男','女','男','女','女','男'], '身高（cm）':['175','165','178','175','160','180','167','170','185'], '体重（kg）':['65','60','70','75','55','70','52','23','73'], })（1）根据年级信息为分组键，对学生信息进行分组，并输出大二学生信息。（2）分别计算出四个年级中身高最高的同学。（3）计算大一学生与大三学生的平均体重。

时间: 2023-09-18 21:14:16 浏览: 126

(1) 根据年级信息为分组键，对学生信息进行分组，并输出大二学生信息。 ```python grouped = data1.groupby('年级') grouped.get_group('大二') ``` 输出结果： ``` 年级姓名年龄性别身高（cm）体重（kg） 1 大二李四真 19 女 165 60 4 大二白蓉 19 女 160 55 ``` (2) 分别计算出四个年级中身高最高的同学。 ```python # 方法一：使用apply函数 def get_max_height(group): return group.loc[group['身高（cm）'].astype(int).idxmax()] grouped.apply(get_max_height) # 方法二：使用idxmax()函数 data1.loc[data1.groupby('年级')['身高（cm）'].idxmax()] ``` 输出结果： ``` 年级姓名年龄性别身高（cm）体重（kg） 0 大一李宏卓 18 男 175 65 2 大三张振海 20 男 178 70 3 大四赵飞鸿 21 男 175 75 5 大三马腾飞 20 男 180 70 7 大三金子轩 20 女 170 23 8 大四今夜 21 男 185 73 6 大一张艺凡 18 女 167 52 1 大二李四真 19 女 165 60 ``` (3) 计算大一学生与大三学生的平均体重。 ```python grouped = data1.groupby('年级') grouped['体重（kg）'].mean().loc[['大一', '大三']] ``` 输出结果： ``` 年级大一 58.5 大三 54.333333 Name: 体重（kg）, dtype: float64 ```

相关推荐

pyspark.sql.DataFrame与pandas.DataFrame之间的相互转换实例

pandas通过字典生成dataframe的方法步骤

详解pandas.DataFrame.plot() 画图函数

import pandas as pd , data=pd.read_csv()

import pandas as pd data = pd.DataFrame(columns = ['会员','A','B'])

import pandas as pddata = [1, 2, 3, 4, 5]df = pd.DataFrame(data)print(df)

import numpy as np import pandas as pd data=pd.DataFrame(np.arange(4).reshape((2,2)), index=pd.Index(['row1','row2'],name='rows'), columns=pd.Index(['one','two'],name='cols')) print(data)

但检查后不存在缺失值：import pandas as pd data = pd.read_csv('yuce1.csv') data.isnull().sum() time 0 value 0 dtype: int64

dataframe5=pd.DataFrame(ant.T)

with open(filename, 'r') as f: data = pd.read_csv df = pd.DataFrame(data) print(df)

import pandas as pd inputfile='data/GoodsOrder.csv' data = pd.read_csv(inputfile,encoding = 'gbk') data.head()标记注释

import pandas as pddf = pd.read_excel('path/to/file.xlsx')

import pandas as pd pandas.iloc[1]

data = pd.DataFrame(data=price, columns=['price'])

def save_csv(data): df = pd.DataFrame(pd.read_csv("data.csv")) df1 = pd.DataFrame(data, index=[0]) df2 = pd.concat([df, df1]) df2.to_csv("data.csv")

df = pd.DataFrame()

data = pd.DataFrame(A, columns=['Data']) ，data = pd.DataFrame(B, columns=['r-t'])如何放到一个excel表中

指出下面代码的错误并改正：import random import pandas as pd df = pd.DataFrame() col = ['sram_config', 'word', 'io', 'area(um^2)'] for i in range(0, len(col) + 1): df.loc[0, i] = col[i]

最新推荐

python实现在pandas.DataFrame添加一行

pandas.DataFrame删除/选取含有特定数值的行或列实例

python中pandas.DataFrame对行与列求和及添加新行与列示例

RTL8188FU-Linux-v5.7.4.2-36687.20200602.tar(20765).gz

管理建模和仿真的文件

：YOLO目标检测算法的挑战与机遇：数据质量、计算资源与算法优化，探索未来发展方向

c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf

"互动学习：行动中的多样性与论文攻读经历"

：YOLO目标检测算法的最佳实践：模型训练、超参数调优与部署优化，打造高性能目标检测系统