将上面的exData01.xlsx,分别按平均值mean、取中数median、最频繁的值填充空值后,另存execl工作薄中Sheet1、Sheet2、Sheet3。
时间: 2024-06-11 14:04:19 浏览: 70
由于题目中没有给出具体的空值填充方式,以下提供两种常见的方式:用平均值填充和用最频繁的值填充。
1. 用平均值填充空值
```python
import pandas as pd
# 读取数据
df = pd.read_excel('exData01.xlsx')
# 按平均值填充空值
df_mean = df.fillna(df.mean())
# 保存数据到新的excel文件中
with pd.ExcelWriter('exData_filled_mean.xlsx') as writer:
df_mean.to_excel(writer, sheet_name='Sheet1', index=False)
```
2. 用最频繁的值填充空值
```python
import pandas as pd
# 读取数据
df = pd.read_excel('exData01.xlsx')
# 按最频繁的值填充空值
df_mode = df.fillna(df.mode().iloc[0])
# 保存数据到新的excel文件中
with pd.ExcelWriter('exData_filled_mode.xlsx') as writer:
df_mode.to_excel(writer, sheet_name='Sheet1', index=False)
```
3. 用中位数填充空值
```python
import pandas as pd
# 读取数据
df = pd.read_excel('exData01.xlsx')
# 按中位数填充空值
df_median = df.fillna(df.median())
# 保存数据到新的excel文件中
with pd.ExcelWriter('exData_filled_median.xlsx') as writer:
df_median.to_excel(writer, sheet_name='Sheet1', index=False)
```
阅读全文