Pandas官方教程：数据操作与选择指南

版权申诉

30 浏览量更新于2024-06-20 收藏 2.53MB DOCX 举报

"pandas学习教程提供了官方教程的多种格式阅读选项，包括在线阅读、PDF、EPUB和MOBI格式，并链接到了代码仓库。教程通过‘十分钟搞定pandas’引导初学者快速了解pandas库，包括创建对象、查看数据、选择数据等核心概念。" 在Python的数据分析领域，pandas是一个不可或缺的库，它提供了高效的数据结构，如Series（一维数组）和DataFrame（二维表格数据）。本教程将深入讲解这些关键知识点。一、创建对象 1. Series的创建通常通过列表或数组，系统会自动生成整型索引。 2. DataFrame可以由numpy数组、时间序列和列标签组合创建，提供灵活的数据组织方式。 3. 字典对象转换为DataFrame时，键成为列名，值对应列的数据。 4. `dtypes`属性可用来查看DataFrame中各列的数据类型。 5. IPython的Tab补全功能方便地展示DataFrame的所有属性和列。二、查看数据 1. 使用`head()`和`tail()`查看DataFrame的前几行和后几行。 2. `index`, `columns`和`values`属性分别显示索引、列名和底层numpy数组数据。 3. `describe()`函数快速生成统计摘要，包括计数、平均值、标准差等。 4. `transpose()`（或`.T`）用于转置DataFrame。 5. `sort_index()`按行索引排序，`sort_values()`按值排序。三、选择数据 1. 选择单个列返回Series，如`df['A']`。 2. 切片操作如`df[start:end]`选择行。 3. `.loc`基于标签选择，支持多轴选择和区间选择。 4. `.iloc`通过位置（整数）选择，适用于行和列。 5. `.ix`结合了标签和位置选择，但已不再推荐使用。 6. 布尔索引允许根据条件筛选数据，如`df[df['A'] > 0]`选择A列大于0的行。这些基本操作构成了pandas数据处理的基础，通过熟练掌握它们，你可以有效地清洗、转换和分析数据。更深入的学习可以涉及合并数据、缺失值处理、时间序列分析以及复杂的聚合操作等。pandas的强大在于它的易用性和高性能，使得数据科学家和工程师能够高效地处理大量数据。

十分钟搞定 Pandas

In [48]: df.at[dates[0],'A'] = 0

In [49]: df.iat[0,1] = 0

In [50]: df.loc[:,'D'] = np.array([5] * len(df))

2、通过标签设置新的值：

3、通过位置设置新的值：

4、通过一个numpy数组设置一组新值：

上述操作结果如下：

In [45]: s1 = pd.Series([1,2,3,4,5,6], index=pd.date_range('2013

0102', periods=6))

In [46]: s1

Out[46]:

2013-01-02

2013-01-03

2013-01-04

2013-01-05

2013-01-06

2013-01-07

Freq: D, dtype: int64

In [47]: df['F'] = s1

剩余214页未读，继续阅读

小小哭包

粉丝: 2050
资源: 4206

Pandas官方教程：数据操作与选择指南

Python机器学习与数据可视化实战教程

Python编程测验题系列：从测验1到测验6

Python数据分析入门教程：掌握Pandas与实战应用

Pandas是什么.docx

Python pandas数据转化.docx

import pandas as pd.docx

Python pandas怎么使用.docx

python-pandas-例子.docx

快速在PYcharm中安装pandas和matplotlib.docx

pandas库开发教程.docx

最新资源