如何查看dataframe中某一列的分布
时间: 2024-05-04 14:17:52 浏览: 6
可以使用pandas库中的`value_counts()`函数来查看dataframe中某一列的分布情况。例如,若要查看名为`col_name`的列的分布情况,则可以使用以下代码:
```
df['col_name'].value_counts()
```
该函数将会返回一个Series对象,其中包含了该列中每个元素的出现次数,按照出现次数从高到低排序。你可以使用`normalize=True`参数来将结果转换为百分比形式,例如:
```
df['col_name'].value_counts(normalize=True)
```
该函数将会返回一个Series对象,其中包含了该列中每个元素出现的百分比,按照百分比从高到低排序。
相关问题
绘制DataFrame某一列正态分布图
可以使用Python中的Matplotlib或Seaborn库绘制DataFrame某一列的正态分布图,具体代码如下:
```python
import seaborn as sns
# 假设DataFrame为df,要绘制的列为col_name
sns.distplot(df[col_name], fit=norm, kde=False)
```
这样就可以绘制出某一列的正态分布图。
matplotlib画dataframe中某一列在另一列上的分布情况
可以使用pandas的plot函数来实现,具体代码如下:
```python
import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_csv('data.csv') # 读取数据
df.plot(x='col1', y='col2', kind='scatter') # 绘制散点图
plt.show() # 显示图形
```
其中,'col1'和'col2'分别表示数据中的两列,kind='scatter'表示绘制散点图。