Python Pandas 0.19.0分析工具手册更新

5星 · 超过95%的资源 需积分: 32 357 下载量 187 浏览量 更新于2024-07-20 5 收藏 12.03MB PDF 举报
"Python Pandas 手册下载" Python Pandas 是一个强大的数据分析工具包,用于处理和操作结构化的数据。这个手册是版本0.19.0,由Wes McKinney和PyData Development Team在2016年10月2日发布。手册包含了新功能、API变化以及其他增强,旨在帮助用户更好地理解和利用Pandas库。 1. **新功能**: - **merge_asof/as_of风格的时间序列连接**:提供了更灵活的数据连接方式,特别是在处理时间序列数据时。 - **.rolling()现在对时间序列敏感**:允许用户基于时间窗口进行计算,如滑动平均或滑动统计。 - **read_csv现在支持重复列名**:改进了读取CSV文件时处理重复列名的功能。 - **直接解析Categorical数据类型**:read_csv现在可以直接识别并处理分类数据。 - **Categorical Concatenation**:增强了对分类数据的拼接操作。 - **Semi-Month Offsets**:新增了半月份的偏移量,方便处理按半月度计算的日期。 - **新的Index方法**:提供了更多对索引操作的方法,增加了灵活性。 - **Google BigQuery增强**:Pandas与Google BigQuery的集成得到了优化。 - **细粒度的numpy错误状态**:允许更精确地控制numpy计算中的错误处理。 - **get_dummies返回整数数据类型**:one-hot编码结果现在默认为整数。 - **downcast_to_smallest_possible_type()到numeric**:自动将值转换为可能的最小数据类型。 - **Pandas开发API**:为开发者提供了更多的工具和接口。 2. **API变化**: - **Series.tolist()现在返回Python类型**:以前可能返回numpy数组,现在改为返回列表。 - **Series操作符处理不同索引**:处理索引不匹配的Series时的行为有所调整。 - **Series类型推广在赋值时**:当向Series分配不同数据类型时,可能会改变Series的类型。 - **.to_datetime()的更改**:日期时间转换函数的行为进行了调整。 - **合并操作的变化**:merge函数的参数和行为可能有所更新。 - **.describe()的更改**:描述性统计函数的输出可能有所不同。 - **Period的更改**:与Period相关的函数和属性可能有所调整。 - **Index + / -不再用于集合操作**:这些运算符现在只进行算术运算,不用于设置操作。 - **Index.difference和.symmetric_difference的更改**:这两个方法的行为现在更一致。 - **Index.unique始终返回Index**:无论输入如何,返回的唯一索引始终是Index对象。 这些变化和增强为用户提供了更多的功能和更高效的处理数据的方式,使得Pandas在数据分析领域更加得心应手。手册详细地介绍了每个新特性,帮助用户逐步适应并充分利用这些改进。对于那些经常使用Pandas进行数据清洗、预处理和分析的Python开发者来说,这个手册是必不可少的参考资源。