用seaborn画直方图,并显示每个柱子的高度
时间: 2023-08-20 09:07:20 浏览: 101
python数据可视化之Seaborn(三)
使用 Seaborn 绘制直方图也非常方便,而且 Seaborn 默认会显示每个柱子的高度。具体步骤如下:
1. 导入必要的库:pandas、seaborn。
```python
import pandas as pd
import seaborn as sns
```
2. 使用 pandas 库中的 read_csv() 函数读取 CSV 文件,并将数据存储到 DataFrame 中。
```python
df = pd.read_csv('data.csv')
```
3. 对 DataFrame 中的数据进行处理,例如去除缺失值、重复值等。
```python
df = df.dropna() # 去除缺失值
df = df.drop_duplicates() # 去除重复值
```
4. 使用 seaborn 库中的 distplot() 函数绘制直方图。在函数中,需要指定待绘制的数据、直方图类型等参数。
```python
sns.distplot(df['column_name'], bins=20, kde=False)
```
其中,'column_name' 是待绘制的数据所在的列名,bins 参数指定了数据分组的数量,kde 参数表示是否显示密度曲线。
5. 最后,添加图表标题和轴标签,并显示图表。
```python
plt.title('Histogram')
plt.xlabel('Value')
plt.ylabel('Frequency')
plt.show()
```
完整的代码如下:
```python
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
# 读取CSV文件
df = pd.read_csv('data.csv')
# 处理数据
df = df.dropna() # 去除缺失值
df = df.drop_duplicates() # 去除重复值
# 绘制直方图
sns.distplot(df['column_name'], bins=20, kde=False)
# 设置图表标题和轴标签
plt.title('Histogram')
plt.xlabel('Value')
plt.ylabel('Frequency')
# 显示图表
plt.show()
```
其中,'data.csv' 是待读取的 CSV 文件名,'column_name' 是待绘制的数据所在的列名。
阅读全文