python数据集找分位数画直方图,找每个维度25%和75%分位数,统计25%到75%之间的数据和大于75%分位数画图(使用不同颜色)
时间: 2024-05-14 09:19:50 浏览: 144
首先,我们需要使用Python中的pandas和matplotlib库来完成任务。以下是一个示例代码,假设我们有一个名为data的数据集:
```python
import pandas as pd
import matplotlib.pyplot as plt
# 读取数据集
data = pd.read_csv('data.csv')
# 找到每个维度的25%和75%分位数
q25 = data.quantile(0.25)
q75 = data.quantile(0.75)
# 统计25%到75%之间的数据
data_between_q = data[(data >= q25) & (data <= q75)]
# 找到大于75%分位数的数据
data_above_q75 = data[data > q75]
# 绘制直方图
plt.hist([data_between_q, data_above_q75], color=['blue', 'red'], alpha=0.5, label=['25%-75%', '>75%'])
plt.legend(loc='upper right')
plt.show()
```
上面的代码会生成一个直方图,其中蓝色表示25%到75%之间的数据,红色表示大于75%分位数的数据。您需要将数据集替换为您自己的数据集,并根据需要更改分位数的百分比和颜色。
相关问题
请给我用Iris数据集找分位数画直方图,找每个维度25%和75%分位数,统计25%到75%之间的数据和大于75%分位数画图的完整代码
好的,以下是使用Python和Pandas库来实现的完整代码:
```python
import pandas as pd
import matplotlib.pyplot as plt
# 读取Iris数据集
iris = pd.read_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data', header=None)
iris.columns = ['sepal_length', 'sepal_width', 'petal_length', 'petal_width', 'class']
# 找每个维度的25%和75%分位数
q1 = iris.quantile(0.25)
q3 = iris.quantile(0.75)
# 统计25%到75%之间的数据
iris_filtered = iris.loc[(iris >= q1) & (iris <= q3)].dropna()
# 大于75%分位数的数据
iris_above_q3 = iris.loc[iris > q3].dropna()
# 画直方图
fig, axs = plt.subplots(2, 2, figsize=(10, 10))
axs[0, 0].hist(iris_filtered['sepal_length'])
axs[0, 0].set_title('Sepal Length')
axs[0, 1].hist(iris_filtered['sepal_width'])
axs[0, 1].set_title('Sepal Width')
axs[1, 0].hist(iris_filtered['petal_length'])
axs[1, 0].set_title('Petal Length')
axs[1, 1].hist(iris_filtered['petal_width'])
axs[1, 1].set_title('Petal Width')
plt.tight_layout()
plt.show()
```
这段代码首先使用Pandas库将Iris数据集读入一个DataFrame对象中。然后,使用DataFrame的`quantile`方法找到每个维度的25%和75%分位数。接着,使用DataFrame的逻辑运算符和`loc`方法筛选出25%到75%之间的数据和大于75%分位数的数据。最后,使用Matplotlib库画出直方图。我们将四个维度的直方图放在一个2x2的网格中以便比较。
阅读全文