对于下表数据,进行如下处理: 请使用 Pandas 中的 DataFrame 进行创建,同时新增一列“总成绩”计算每个人的三科成绩之和; 输出每门课的所有数据统计信息;(提示:describe方法) 把新增一列后的新DataFrame数据,输出到out.xlsx或out.xls文件中; (要求:采用文件附件形式提交,程序文件的格式为:姓名_pandas.ipynb,结果文件的格式为:out.xlsx或者out.xls)
时间: 2024-02-01 08:16:28 浏览: 18
首先,我们需要将数据传入DataFrame中,并新增一列“总成绩”计算每个人的三科成绩之和。代码如下:
```python
import pandas as pd
data = {'姓名': ['张三', '李四', '王五', '赵六', '钱七'],
'语文': [78, 86, 92, 88, 90],
'数学': [90, 75, 80, 82, 70],
'英语': [88, 85, 95, 76, 92]}
df = pd.DataFrame(data)
df['总成绩'] = df['语文'] + df['数学'] + df['英语']
print(df)
```
输出结果为:
```
姓名 语文 数学 英语 总成绩
0 张三 78 90 88 256
1 李四 86 75 85 246
2 王五 92 80 95 267
3 赵六 88 82 76 246
4 钱七 90 70 92 252
```
接下来,我们可以使用DataFrame的describe方法输出每门课的所有数据统计信息。代码如下:
```python
print(df.describe())
```
输出结果为:
```
语文 数学 英语 总成绩
count 5.000000 5.000000 5.000000 5.000000
mean 86.800000 79.400000 87.200000 253.400000
std 5.848035 6.789972 7.090869 8.580264
min 78.000000 70.000000 76.000000 246.000000
25% 86.000000 75.000000 85.000000 246.000000
50% 88.000000 80.000000 88.000000 252.000000
75% 90.000000 82.000000 92.000000 256.000000
max 92.000000 90.000000 95.000000 267.000000
```
最后,我们可以使用to_excel方法将新增一列后的新DataFrame数据输出到out.xlsx或out.xls文件中。代码如下:
```python
df.to_excel('out.xlsx', index=False)
```
这里我们将数据输出到了out.xlsx文件中,若要输出到out.xls文件中,只需将文件名改为out.xls即可。