pandas 两列数据直方图
时间: 2023-11-23 16:58:17 浏览: 263
以下是使用pandas绘制两列数据直方图的方法:
假设我们要绘制homes数据集中的sqft_living和price两列数据的直方图。
```python
import pandas as pd
import matplotlib.pyplot as plt
# 读取数据
homes = pd.read_excel('C:/Tools/Python/Pandas/014/home_data.xlsx')
# 绘制直方图
homes[['sqft_living', 'price']].plot.hist(alpha=0.5, bins=50)
# 设置图例和标题
plt.legend(['sqft_living', 'price'])
plt.title('Histogram of sqft_living and price')
# 显示图形
plt.show()
```
运行以上代码,即可得到sqft_living和price两列数据的直方图。
相关问题
pandas 两列数据累积分布的关系,以及作图
在 Pandas 中,可以使用 `DataFrame.plot()` 方法将两列数据的累计分布关系作图。
首先,需要载入所需的库:
```python
import pandas as pd
import matplotlib.pyplot as plt
```
然后,假设你有一个名为 `df` 的 DataFrame,包含两列数据 `col1` 和 `col2`。你可以使用如下代码绘制累计分布关系图:
```python
df[['col1', 'col2']].plot.cumulative(title='Cumulative distribution of col1 and col2')
plt.show()
```
这将在图中绘制两条曲线,分别表示 `col1` 和 `col2` 的累计分布关系。
如果你想要更多的控制,也可以使用 `DataFrame.plot.hist()` 方法绘制直方图,并使用 `cumsum()` 方法计算累计值,然后使用 `plot()` 方法绘制曲线图。
例如:
```python
df[['col1', 'col2']].plot.hist(density=True, cumulative=True, histtype='step')
plt.show()
```
这将绘制出累计分布图,其中两条曲线分别表示 `col1` 和 `col2` 的累计分布。
希望这能帮到你!
python基于csv文件用不同颜色将两列数据画直方图
你可以使用Python中的matplotlib库来绘制直方图,并使用pandas库来读取csv文件。
以下是一个示例代码,可以读取csv文件中的两列数据,分别绘制直方图,并用不同颜色表示:
```python
import pandas as pd
import matplotlib.pyplot as plt
# 读取csv文件
data = pd.read_csv('data.csv')
# 选择需要绘制直方图的两列数据
x = data['Column1']
y = data['Column2']
# 绘制直方图
plt.hist(x, color='red', alpha=0.5, label='Column1')
plt.hist(y, color='blue', alpha=0.5, label='Column2')
# 添加图例和标签
plt.legend(loc='best')
plt.xlabel('Value')
plt.ylabel('Frequency')
plt.title('Histogram')
# 显示图形
plt.show()
```
在这个示例代码中,我们首先使用pandas库的read_csv函数读取csv文件,然后选择需要绘制直方图的两列数据。接着,使用matplotlib库的hist函数绘制直方图,并使用不同颜色表示两列数据。最后,我们添加图例和标签,并使用show函数显示图形。
阅读全文