#1、导入必要的库,并将成绩表.xls 的数据导入到 DataFrame 类型变量 score 中。
import pandas as pd
import numpy as np
score=pd.read_excel("成绩表.xls")
score
#2、为 score 新增总分列和平均分列
score['总分']=score.apply(lambda x:x[5:17].sum(),axis=1)
score['平均分']=score.apply(lambda x:x[5:17].mean(),axis=1)
score
or
score.drop([‘总分’],[‘平均分’],axis=1,inplace=True) #删除刚刚新建的列
score[‘总分’]=score.loc[:,’语文’:’艺术’].sum(axis=1)
score[‘平均分’]=score.loc[:,’语文’:’艺术’].mean(axis=1).round(3)
score
#3、打印出前 10 行
score.head(10)
#4、打印出每一列的数据类型
score.info()
#5、如何查看 score 中有多少行
score.shape(0)
#6、快速统计出各科成绩的计数,平均数,方差,最小值,最大值,quan/le 百分数值等信
息
score.loc[:,’语文’:’艺术’].describe()
or
score.iloc[:,5:17].describe()
#7、2 班平均语文成绩是多少?成绩保留到小数点后 3 位。
Round(score[score['所在班级']=='2 班'][['语文']].mean(),3)
#8、2 班数学最高分是多少?最低分是多少?
score[score['所在班级']=='2 班'][['数学']].agg([np.max,np.min])
#9、2 班有多少个姓杨的同学?
score[(score['所在班级']=='2 班') & (score['姓名'].str.slice(0:1)=='杨')].shape[0] #shape 用来取
数值
or
score[(score['所在班级']=='2 班') & (score['姓名'].str[0:1]=='杨')].shape[0]
or
score[(score['所在班级']=='2 班') & (score['姓名'].str.startswith(‘杨'))].shape[0]
评论3