dataframe中数据的正态性检验及可视化
时间: 2024-06-08 10:06:22 浏览: 7
在Python中,我们可以使用SciPy库和Seaborn库来进行数据的正态性检验和可视化。
首先,我们需要导入相关的库和数据:
```python
import pandas as pd
import scipy.stats as stats
import seaborn as sns
df = pd.read_csv('data.csv')
```
接下来,我们可以使用Shapiro-Wilk检验来检验数据是否符合正态分布。如果p值小于0.05,则拒绝原假设,认为数据不符合正态分布。
```python
stat, p = stats.shapiro(df['column_name'])
print('Statistic=%.3f, p=%.3f' % (stat, p))
if p > 0.05:
print('数据符合正态分布')
else:
print('数据不符合正态分布')
```
然后,我们可以使用Seaborn库来可视化数据的分布情况。如果数据符合正态分布,则可以使用distplot函数绘制直方图和概率密度曲线;如果数据不符合正态分布,则可以使用kdeplot函数绘制核密度估计曲线。
```python
sns.distplot(df['column_name'], fit=stats.norm)
```
```python
sns.kdeplot(df['column_name'], shade=True)
```
除此之外,我们还可以使用QQ图(Quantile-Quantile Plot)来检验数据是否符合正态分布。如果数据符合正态分布,则QQ图上的点应该大致呈现直线状;否则,点的分布将会偏离直线。
```python
stats.probplot(df['column_name'], dist="norm", plot=plt)
plt.show()
```
相关推荐
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)