Python数据分析实战:数据可视化用pyecharts与bokeh

版权申诉
0 下载量 171 浏览量 更新于2024-07-08 收藏 1.29MB PDF 举报
在Python动手学数据分析的第四章节,主要探讨了数据可视化的应用,以泰坦尼克号数据集为例。这一章详细介绍了几个流行的Python可视化库,如pyecharts和bokeh,以及如何利用它们进行数据展示。 首先,章节涵盖了pyecharts库,这是一种用于创建交互式图表的强大工具。通过这个库,学习者可以创建柱状图,如使用`Bar`类来显示一年降水量与蒸发量的变化,通过`mark_line`和`mark_point`功能添加平均值线和最大最小值标记。 接着,章节重点讲解了如何使用`fake`库生成模拟数据,这对于理解数据生成和可视化过程非常有帮助。它提供了一种创建随机数据的方法,包括指定数据类型。常用方法如随机生成指定类型的数值或类别数据,这对于构建测试场景和理解数据分布至关重要。 泰坦尼克号数据集的应用实例中,展示了如何通过`unstack()`和`stack()`方法转换数据,以展示性别与生存状况的对比,以及生存人数与死亡人数的比例图。默认的`plot()`函数通常用于绘制折线图,但在这里,它被用来呈现不同票价下的生存与死亡人数分布,并通过`sort_values()`函数对数据进行排序。 任务六涉及年龄分布的可视化,通过`bins`参数进行数据分段,然后使用`hist()`函数创建直方图,并调整透明度(`alpha`)和添加密度曲线。另外,还讨论了不同仓位等级的年龄分布,这里可能换用了另一种库(如seaborn或matplotlib)中的`kdeplot()`函数,以展示更精细的核密度估计图。 这一章节不仅教授了基础的数据可视化技术,如柱状图和直方图的制作,还强调了在实际应用中如何灵活运用这些工具,以及如何根据数据特性选择合适的可视化方法。此外,通过使用不同的库,学习者能够了解到Python数据可视化生态系统的多样性,有助于他们在实际工作中做出最佳选择。