读取tips数据集 ,用pyecharts作图 (1)不同性别在不同用餐时间段小费和消费的平均值的柱状图 (2)不同size的的计数饼图
时间: 2024-05-04 12:18:42 浏览: 120
好的,我来给您介绍一下如何使用 Python 和 pyecharts 进行数据可视化。
首先,你需要安装 pyecharts 和 pandas 库,你可以在命令行中输入以下命令进行安装:
```
pip install pyecharts
pip install pandas
```
接下来,我们需要导入需要用到的库:
```python
import pandas as pd
from pyecharts import options as opts
from pyecharts.charts import Bar, Pie
```
然后,我们需要读取 tips 数据集,你可以下载这个数据集,或者使用 seaborn 库中的 tips 数据集。这里我选择使用 seaborn 库中的数据集。
```python
import seaborn as sns
tips = sns.load_dataset("tips")
```
接下来,我们可以对数据集进行处理,计算出不同性别在不同用餐时间段小费和消费的平均值,并将其存储在 DataFrame 中。
```python
# 不同性别在不同用餐时间段小费和消费的平均值
df1 = tips.groupby(["sex", "time"]).mean().reset_index()[["sex", "time", "tip", "total_bill"]]
# 不同size的的计数
df2 = tips.groupby(["size"]).size().reset_index()
df2.columns = ["size", "count"]
```
接下来,我们可以使用 pyecharts 进行数据可视化了。
(1)不同性别在不同用餐时间段小费和消费的平均值的柱状图
```python
# 不同性别在不同用餐时间段小费和消费的平均值的柱状图
bar = (
Bar()
.add_xaxis(df1["time"].unique().tolist())
.add_yaxis("Male", df1[df1["sex"]=="Male"]["total_bill"].tolist())
.add_yaxis("Female", df1[df1["sex"]=="Female"]["total_bill"].tolist())
.set_global_opts(title_opts=opts.TitleOpts(title="不同性别在不同用餐时间段小费和消费的平均值"),
legend_opts=opts.LegendOpts(is_show=True))
.set_series_opts(label_opts=opts.LabelOpts(is_show=True))
)
bar.render_notebook()
```
(2)不同size的的计数饼图
```python
# 不同size的的计数饼图
pie = (
Pie()
.add("", df2.values.tolist())
.set_global_opts(title_opts=opts.TitleOpts(title="不同size的的计数饼图"),
legend_opts=opts.LegendOpts(is_show=True))
.set_series_opts(label_opts=opts.LabelOpts(is_show=True, formatter="{b}: {c}"))
)
pie.render_notebook()
```
这样,我们就可以通过 pyecharts 对 tips 数据集进行可视化了。
阅读全文