df.boxplot用法
时间: 2023-10-10 10:04:33 浏览: 43
`df.boxplot()`方法的用法如下:
```python
df.boxplot(column=None, by=None, ax=None, fontsize=None, rot=0, grid=True, figsize=None, layout=None, return_type=None, **kwds)
```
其中,常用的参数如下:
- `column`:指定要绘制箱线图的列名或列的序号;
- `by`:指定按哪一列进行分组,用于绘制分组箱线图;
- `ax`:指定绘制的图形所在的坐标轴;
- `fontsize`:指定文本字体的大小;
- `rot`:指定横坐标标签的旋转角度;
- `grid`:是否显示网格线;
- `figsize`:指定图形的尺寸大小,以元组形式表示;
- `layout`:用于指定分组箱线图的布局方式,以元组形式表示;
- `return_type`:指定返回值类型,可选值包括`dict`、`DataFrame`或`None`。
例如,假设我们有一个名为`df`的DataFrame对象,其中包含三列数据`A`、`B`和`C`,我们可以使用以下代码绘制这三列数据的箱线图:
```python
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
# 创建示例数据
data = np.random.randn(1000, 3)
df = pd.DataFrame(data, columns=['A', 'B', 'C'])
# 绘制箱线图
df.boxplot()
plt.show()
```
这将绘制出一个包含三个箱线图的图形,每个箱线图代表一列数据的分布情况。如果我们想按照某一列进行分组,同时绘制多个箱线图,可以使用`by`参数指定分组列名,例如:
```python
df.boxplot(column=['A', 'B'], by='C')
plt.show()
```
这将绘制出一个包含两个箱线图的图形,每个箱线图代表两列数据的分布情况,按照`C`列进行分组。