DataFrame数据处理 (1)将某超市销售数据从ExceI文件中读入DataFrame结构生成d对象。( 假设Excel文件与源程序文件在同一目录下) (2)查看交易额”这一列的统计信息。 (3)查看“交易额最大的10条记录o篡习 (4)查看交易额最小的10条记录。 (5)对交易额和工号降序排序。. (6)统计每个员工的上班次数。 (7)统计每个柜台的交易总额。 (8)统计每个员工交易额的平均值,结果按平均值升序排序。 (9)将包含缺失值的行丢弃。
时间: 2024-03-01 20:53:56 浏览: 40
好的,我来一步一步回答你的问题:
(1) 读入Excel文件生成DataFrame对象d
```python
import pandas as pd
# 读入Excel文件生成DataFrame对象d
d = pd.read_excel('sales_data.xlsx')
```
(2) 查看“交易额”这一列的统计信息
```python
# 查看“交易额”这一列的统计信息
print(d['交易额'].describe())
```
(3) 查看交易额最大的10条记录
```python
# 查看交易额最大的10条记录
print(d.nlargest(10, '交易额'))
```
(4) 查看交易额最小的10条记录
```python
# 查看交易额最小的10条记录
print(d.nsmallest(10, '交易额'))
```
(5) 对交易额和工号降序排序
```python
# 对交易额和工号降序排序
d = d.sort_values(['交易额', '工号'], ascending=[False, False])
```
(6) 统计每个员工的上班次数
```python
# 统计每个员工的上班次数
print(d['工号'].value_counts())
```
(7) 统计每个柜台的交易总额
```python
# 统计每个柜台的交易总额
print(d.groupby('柜台')['交易额'].sum())
```
(8) 统计每个员工交易额的平均值,结果按平均值升序排序
```python
# 统计每个员工交易额的平均值,结果按平均值升序排序
mean_sales = d.groupby('工号')['交易额'].mean()
mean_sales = mean_sales.sort_values()
print(mean_sales)
```
(9) 将包含缺失值的行丢弃
```python
# 将包含缺失值的行丢弃
d = d.dropna()
```
阅读全文