python数据描述性分析
时间: 2023-12-28 13:05:56 浏览: 24
以下是Python进行数据描述性分析的一些常用方法和函数:
1. 描述性统计
可以使用pandas库中的describe()函数来获取数据的描述性统计信息,包括计数、均值、标准差、最小值、25%分位数、中位数、75%分位数和最大值等。
```python
import pandas as pd
data = pd.read_csv('data.csv') # 读取数据文件
print(data.describe()) # 输出数据的描述性统计信息
```
2. 相关系数
可以使用pandas库中的corr()函数来计算数据的相关系数矩阵,可以用来衡量两个变量之间的线性关系。
```python
import pandas as pd
data = pd.read_csv('data.csv') # 读取数据文件
print(data.corr()) # 输出数据的相关系数矩阵
```
3. 直方图
可以使用matplotlib库中的hist()函数来绘制数据的直方图,可以用来观察数据的分布情况。
```python
import matplotlib.pyplot as plt
import pandas as pd
data = pd.read_csv('data.csv') # 读取数据文件
plt.hist(data['column_name'], bins=10) # 绘制直方图
plt.show() # 显示图形
```
4. 箱线图
可以使用matplotlib库中的boxplot()函数来绘制数据的箱线图,可以用来观察数据的分布情况和异常值情况。
```python
import matplotlib.pyplot as plt
import pandas as pd
data = pd.read_csv('data.csv') # 读取数据文件
plt.boxplot(data['column_name']) # 绘制箱线图
plt.show() # 显示图形
```