利用Python进行数据分析_第二版中文1: pandas数据分析实战指南

需积分: 0 5 下载量 65 浏览量 更新于2023-11-23 收藏 34.84MB PDF 举报
《利用Python进行数据分析_第二版》是一本关于数据分析和数据科学的书籍,作者于2008年初开始开发pandas,当时任职于AQRCapitalManagement,一家量化投资管理公司。由于许多业务需求无法用现有的工具解决,作者开始研发pandas并编写本书。本书共分为14章和2个附录,全面介绍了数据分析的相关内容。 第1章至第3章介绍了准备工作、Python语法基础以及Python的数据结构、函数和文件操作。第4章到第8章讲解了NumPy和pandas的基础知识,包括数组、矢量计算、数据加载、存储、清洗和准备,以及数据的聚合、合并和重塑。第9章到第13章探讨了数据的可视化、聚合与分组运算、时间序列以及pandas的高级应用和Python建模库。最后一章是数据分析的案例分析,附录部分介绍了NumPy的高级应用以及更多关于IPython的内容。 本书的更新主要包括将所有代码升级为Python 3.6,更新了Anaconda和其他包的Python安装方法,以及新增了关于更高级的pandas工具和使用StatsModels和scikit-learn的内容。相比第一版,《利用Python进行数据分析_第二版》更加全面和实用,适合对数据分析和数据科学感兴趣的读者阅读学习。