用python完成下列可视化分析(1) 查看星巴克旗下有哪些品牌?如果我们只关心星巴克咖啡门店,则只需获取星巴克中的BRAND列,并查看其唯一值。 (2)查看全世界一共多少个国家开设了星巴克门店,显示门店数量排名前10和后10的国家。用柱状图绘制排名前10的分布情况。设置xlabel为’Countries’,ylabel为’Store Counts’,title为’星巴克门店数排名前10的国家’。 (3)按照星巴克门店在中国的分布情况,统计排名前10的城市,绘制柱状图。设置xlabel为’ Cities’,ylabel为’Store Counts’,title为’ 中国拥有星巴克门店最多的10个城市’。 (4)绘制星巴克门店经纬的散点图。设置散点图的颜色为红色 (5)用饼图显示星巴克门店经营方式有哪几种。经营方式为Ownership Type列 (6)任意数据的任意可视化分析结果。
时间: 2024-02-28 20:57:52 浏览: 112
以下是用 Python 完成上述可视化分析的代码实现:
```python
import pandas as pd
import matplotlib.pyplot as plt
# 读取 Starbucks 数据集
starbucks = pd.read_csv('directory.csv')
# 1. 查看星巴克旗下有哪些品牌
brands = starbucks['Brand'].unique()
print(f'Starbucks 旗下有 {len(brands)} 个品牌,分别是:')
for brand in brands:
print(brand)
# 2. 查看全世界一共多少个国家开设了星巴克门店,显示门店数量排名前10和后10的国家
store_counts = starbucks['Country'].value_counts()
top10 = store_counts.head(10)
bottom10 = store_counts.tail(10)
# 绘制排名前10的柱状图
plt.bar(top10.index, top10.values)
plt.xlabel('Countries')
plt.ylabel('Store Counts')
plt.title('星巴克门店数排名前10的国家')
plt.show()
# 3. 按照星巴克门店在中国的分布情况,统计排名前10的城市,绘制柱状图
china_stores = starbucks[starbucks['Country'] == 'CN']
china_cities = china_stores['City'].value_counts().head(10)
# 绘制排名前10的柱状图
plt.bar(china_cities.index, china_cities.values)
plt.xlabel('Cities')
plt.ylabel('Store Counts')
plt.title('中国拥有星巴克门店最多的10个城市')
plt.show()
# 4. 绘制星巴克门店经纬的散点图
plt.scatter(starbucks['Longitude'], starbucks['Latitude'], c='red')
plt.show()
# 5. 用饼图显示星巴克门店经营方式有哪几种
ownership_counts = starbucks['Ownership Type'].value_counts()
plt.pie(ownership_counts.values, labels=ownership_counts.index)
plt.title('星巴克门店经营方式')
plt.show()
# 6. 任意数据的任意可视化分析结果
# 以星巴克门店在美国的分布情况为例,统计排名前10的州,绘制柱状图
us_stores = starbucks[starbucks['Country'] == 'US']
us_states = us_stores['State/Province'].value_counts().head(10)
# 绘制排名前10的柱状图
plt.bar(us_states.index, us_states.values)
plt.xlabel('States')
plt.ylabel('Store Counts')
plt.title('美国拥有星巴克门店最多的10个州')
plt.show()
```
以上代码实现需要先下载 `directory.csv` 文件,该文件可以在 Kaggle 上找到。
阅读全文