#绘制频次前10的药材直方图,药材数据在pcm2020_hz.xlsx
时间: 2024-12-21 18:23:43 浏览: 7
要在Python中使用Pandas和Matplotlib绘制pcm2020_hz.xlsx文件中药材数据的频率分布直方图,你需要先按药材分类计数,然后选择最常见的前10种药材,最后创建直方图。以下是具体的步骤:
1. 首先,导入所需的库:
```python
import pandas as pd
import matplotlib.pyplot as plt
```
2. 读取Excel数据:
```python
df = pd.read_excel('pcm2020_hz.xlsx')
```
3. 确定药材列名,这里假设列名为'drug_name':
```python
drug_names = df['drug_name']
```
4. 计算每个药材的出现次数(频率),并将结果存储在一个Series中:
```python
freq_series = drug_names.value_counts()
```
5. 取出现频率最高的前10个药材:
```python
top_10_drugs = freq_series.head(10)
```
6. 绘制直方图:
```python
plt.figure(figsize=(10, 6)) # 设置图形大小
plt.hist(top_10_drugs.index, bins=top_10_drugs.index.values, weights=top_10_drugs) # x轴为药材名称,权重为频次
plt.xlabel('药材名称')
plt.ylabel('频次')
plt.title('药材频率前10位直方图')
plt.show()
```
这样就得到了一个展示了前10种常见药材的频次直方图。
阅读全文