根据某餐厅日常销售数据(catering_sale.xls)进行数据质量分析,缺失值过滤,过滤掉含有缺失值记录,异常检测,绘制箱图,保留箱图上的数据,进行必要的类型转换Timestamp。 统计量分析包括count,mean,std,min,max,25%,50%,75%,dis,var,range
时间: 2024-03-10 21:45:18 浏览: 10
好的,这是一个数据分析的任务,需要用到Python的pandas、numpy和matplotlib包。以下是代码实现:
```python
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
# 读取数据
data = pd.read_excel('catering_sale.xls')
# 缺失值过滤
data = data.dropna()
# 异常检测
statistics = data.describe() # 统计量分析
Q1 = statistics.loc['25%', '销售额']
Q3 = statistics.loc['75%', '销售额']
IQR = Q3 - Q1
outlier_min = Q1 - 1.5 * IQR # 下限
outlier_max = Q3 + 1.5 * IQR # 上限
data = data[(data['销售额'] >= outlier_min) & (data['销售额'] <= outlier_max)]
# 绘制箱图
plt.boxplot(data['销售额'])
plt.show()
# 类型转换
data['日期'] = pd.to_datetime(data['日期'], format='%Y%m%d')
# 统计量分析
count = data['销售额'].count()
mean = data['销售额'].mean()
std = data['销售额'].std()
min = data['销售额'].min()
max = data['销售额'].max()
Q1 = data['销售额'].quantile(0.25)
Q2 = data['销售额'].quantile(0.5)
Q3 = data['销售额'].quantile(0.75)
dis = Q3 - Q1
var = data['销售额'].var()
range = max - min
print('count:', count)
print('mean:', mean)
print('std:', std)
print('min:', min)
print('max:', max)
print('25%:', Q1)
print('50%:', Q2)
print('75%:', Q3)
print('dis:', dis)
print('var:', var)
print('range:', range)
```
以上代码实现了数据的缺失值过滤、异常检测、箱图绘制和类型转换,并进行了统计量分析。其中,统计量分析包括count,mean,std,min,max,25%,50%,75%,dis,var和range。
相关推荐
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![apk](https://img-home.csdnimg.cn/images/20210720083646.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)