用Python写数据分析与可视化 查看星巴克旗下有哪些品牌。如果只关心星巴克咖啡门店,则只需要获取星巴克种Brand的数据集,并查看全世界一共有多少家星巴克门店的Python代码
时间: 2023-05-22 18:05:42 浏览: 170
可以使用Pandas和Matplotlib库来进行数据分析与可视化。以下是一份Python代码示例:
```python
import pandas as pd
import matplotlib.pyplot as plt
# 读取数据集
df = pd.read_csv("starbucks.csv")
# 查看所有品牌
brands = df["Brand"].unique()
print("所有品牌:", brands)
# 查看星巴克品牌门店数
starbucks_df = df[df["Brand"]=="Starbucks"]
num_stores = starbucks_df.shape[0]
print("全球星巴克门店数:", num_stores)
# 可视化不同品牌门店数
brand_counts = df["Brand"].value_counts()
brand_counts.plot(kind="bar")
plt.title("各品牌门店数")
plt.xlabel("品牌")
plt.ylabel("门店数")
plt.show()
```
需要注意的是,代码中的数据集文件需要提前下载并放置在当前文件夹下。此外,代码还使用了一些Python的基础知识,例如读取文件、统计数据、绘图等。
相关问题
用python完成下列可视化分析(1) 查看星巴克旗下有哪些品牌?如果我们只关心星巴克咖啡门店,则只需获取星巴克中的BRAND列,并查看其唯一值。 (2)查看全世界一共多少个国家开设了星巴克门店,显示门店数量排名前10和后10的国家。用柱状图绘制排名前10的分布情况。设置xlabel为’Countries’,ylabel为’Store Counts’,title为’星巴克门店数排名前10的国家’。 (3)按照星巴克门店在中国的分布情况,统计排名前10的城市,绘制柱状图。设置xlabel为’ Cities’,ylabel为’Store Counts’,title为’ 中国拥有星巴克门店最多的10个城市’。 (4)绘制星巴克门店经纬的散点图。设置散点图的颜色为红色 (5)用饼图显示星巴克门店经营方式有哪几种。经营方式为Ownership Type列 (6)任意数据的任意可视化分析结果。
以下是用 Python 完成上述可视化分析的代码实现:
```python
import pandas as pd
import matplotlib.pyplot as plt
# 读取 Starbucks 数据集
starbucks = pd.read_csv('directory.csv')
# 1. 查看星巴克旗下有哪些品牌
brands = starbucks['Brand'].unique()
print(f'Starbucks 旗下有 {len(brands)} 个品牌,分别是:')
for brand in brands:
print(brand)
# 2. 查看全世界一共多少个国家开设了星巴克门店,显示门店数量排名前10和后10的国家
store_counts = starbucks['Country'].value_counts()
top10 = store_counts.head(10)
bottom10 = store_counts.tail(10)
# 绘制排名前10的柱状图
plt.bar(top10.index, top10.values)
plt.xlabel('Countries')
plt.ylabel('Store Counts')
plt.title('星巴克门店数排名前10的国家')
plt.show()
# 3. 按照星巴克门店在中国的分布情况,统计排名前10的城市,绘制柱状图
china_stores = starbucks[starbucks['Country'] == 'CN']
china_cities = china_stores['City'].value_counts().head(10)
# 绘制排名前10的柱状图
plt.bar(china_cities.index, china_cities.values)
plt.xlabel('Cities')
plt.ylabel('Store Counts')
plt.title('中国拥有星巴克门店最多的10个城市')
plt.show()
# 4. 绘制星巴克门店经纬的散点图
plt.scatter(starbucks['Longitude'], starbucks['Latitude'], c='red')
plt.show()
# 5. 用饼图显示星巴克门店经营方式有哪几种
ownership_counts = starbucks['Ownership Type'].value_counts()
plt.pie(ownership_counts.values, labels=ownership_counts.index)
plt.title('星巴克门店经营方式')
plt.show()
# 6. 任意数据的任意可视化分析结果
# 以星巴克门店在美国的分布情况为例,统计排名前10的州,绘制柱状图
us_stores = starbucks[starbucks['Country'] == 'US']
us_states = us_stores['State/Province'].value_counts().head(10)
# 绘制排名前10的柱状图
plt.bar(us_states.index, us_states.values)
plt.xlabel('States')
plt.ylabel('Store Counts')
plt.title('美国拥有星巴克门店最多的10个州')
plt.show()
```
以上代码实现需要先下载 `directory.csv` 文件,该文件可以在 Kaggle 上找到。
阅读全文