旅游景点.xlsx中有一列“星级”,现在用jupyter的matplotlib库获取该数据集“星级”一列有4A和5A数据的城市景区的城市以及数量饼图
时间: 2023-11-13 07:02:58 浏览: 99
java获取excel具体一列
3星 · 编辑精心推荐
好的,我明白了。首先,需要安装 matplotlib 库,你可以在命令行中使用以下命令来安装:
```
!pip install matplotlib
```
接下来,你可以使用 pandas 库来读取 Excel 文件。以下是读取 Excel 文件的代码:
```python
import pandas as pd
df = pd.read_excel('旅游景点.xlsx')
```
然后,你需要筛选出“星级”为 4A 和 5A 的数据,并统计每个城市的数量。以下是筛选和统计数量的代码:
```python
# 筛选出星级为 4A 和 5A 的数据
df_filtered = df[(df['星级'] == '4A') | (df['星级'] == '5A')]
# 统计每个城市的数量
city_counts = df_filtered['城市'].value_counts()
```
最后,你可以使用 matplotlib 库来生成饼图。以下是生成饼图的代码:
```python
import matplotlib.pyplot as plt
# 获取城市和数量的列表
labels = city_counts.index.tolist()
counts = city_counts.tolist()
# 绘制饼图
plt.pie(counts, labels=labels, autopct='%1.1f%%')
plt.axis('equal')
plt.title('4A和5A数据的城市景区的城市以及数量')
plt.show()
```
将上述代码整合起来,以下是完整的代码:
```python
import pandas as pd
import matplotlib.pyplot as plt
# 读取 Excel 文件
df = pd.read_excel('旅游景点.xlsx')
# 筛选出星级为 4A 和 5A 的数据
df_filtered = df[(df['星级'] == '4A') | (df['星级'] == '5A')]
# 统计每个城市的数量
city_counts = df_filtered['城市'].value_counts()
# 获取城市和数量的列表
labels = city_counts.index.tolist()
counts = city_counts.tolist()
# 绘制饼图
plt.pie(counts, labels=labels, autopct='%1.1f%%')
plt.axis('equal')
plt.title('4A和5A数据的城市景区的城市以及数量')
plt.show()
```
运行这段代码,即可生成饼图。注意,你需要将 Excel 文件和代码放在同一个目录下。
阅读全文