Pandas数据选取详解：df[] vs df.loc[] vs df.iloc[] vs df.ix[] vs df.at[] vs df.iat[]

201 浏览量更新于2023-03-03 5 收藏 78KB PDF 举报

在Python的数据分析工具包Pandas中，数据选取是核心操作之一，它涉及到DataFrame和Series这两种数据结构的选择与定位。本文将深入讲解Pandas中的六种主要数据选取方法：df[]、df.loc[]、df.iloc[]、df.ix[]、df.at[]和df.iat[]。 1. **df[]**: 这是一种单一维度的数据选取，仅支持行或列的选择。例如，`df['column_name']`用于选取某一列的所有数据，`df[df['column_name'] > value]`则会根据指定条件选择某列中值大于某个值的行。这种方法一次只能针对一个维度设置筛选条件。 2. **df.loc[]** 和 **df.iloc[]**: 这两种方法用于多维度数据选取，它们允许同时设置多个条件筛选。df.loc[]基于标签（index），可以根据行名和列名进行精确选取，如`df.loc[row_indexer, column_indexer]`。df.iloc[]则是基于位置，适用于整数索引，如`df.iloc[row_indexer, column_indexer]`。两者都可以处理混合的标签和位置索引。 3. **df.ix[]**: 在旧版本的Pandas中常用，但在新版本中已被废弃，推荐使用df.loc[]或df.iloc[]。df.ix[]结合了loc和iloc的优点，支持混合索引，但新版本为了统一API，建议避免使用。 4. **df.at[]**: 这种方法用于精确选取DataFrame中单个元素，仅适用于列名和行索引都是唯一的场景，如`df.at[row_label, column_label]`。 5. **df.iat[]**: 同样用于单个元素选取，但使用的是整数索引，适合快速访问特定位置的值，如`df.iat[row_position, column_position]`。通过以上介绍，理解这些数据选取方法对于高效处理Pandas DataFrame数据至关重要。在实际应用中，根据具体需求选择合适的方法可以大大提高数据分析的效率。举例说明： ```python # 使用df[]选取一列 male_df = df[df['gender'] == 1] # 使用df.loc[]选取满足特定条件的行和列 selected_rows = df.loc[(df['age'] > 20) & (df['isMarried'] == 'yes')] # 使用df.iloc[]选取指定位置的行 first_row = df.iloc[0] # 使用df.at[]获取特定行和列的值 age_of_joe = df.at['a', 'age'] # 使用df.iat[]获取特定位置的年龄 first_age = df.iat[0, 1] ``` 通过这些例子，读者可以在实践中熟练掌握Pandas数据选取的各种技巧，从而在数据分析和项目开发中得心应手。

b Mike 32.0 0 yes

g Wansi 41.0 0 no

i Jason 37.0 1 no

j Even 32.0 0 no

选取出所有age大于30，且isMarried为no的行

>>> df[(df['age']>30) & (df['isMarried']=='no')]

name age gender isMarried

g Wansi 41.0 0 no

i Jason 37.0 1 no

j Even 32.0 0 no

选取出所有age为20或32的行

>>> df[(df['age']==20) | (df['age']==32)]

name age gender isMarried

b Mike 32.0 0 yes

f Marry 20.0 1 no

j Even 32.0 0 no

注意：像上面这种通过多个布尔条件判断的情况，多个条件最好（一定）用括号括起来，否则非常容易出错。

2）列选取

列选取方式也有三种：标签索引、标签列表、Callable对象

a）标签索引：选取单个列

选取name列所有数据

>>> df['name']

a Joe

b Mike

c Jack

d Rose

e David

f Marry

g Wansi

h Sidy

i Jason

j Even

Name: name, dtype: object

b）标签列表：选取多个列

选取name和age两列数据

>>> df[['name','age']]

name age

a Joe 25.0

b Mike 32.0

c Jack 18.0

剩余10页未读，继续阅读

weixin_38691742

粉丝: 4
资源: 903

Pandas数据选取详解：df[] vs df.loc[] vs df.iloc[] vs df.ix[] vs df.at[]...

最新资源

Pandas数据选取详解：df[] vs df.loc[] vs df.iloc[] vs df.ix[] vs df.at[]...

详解pandas DataFrame的查询方法（loc,iloc,at,iat,ix的用法和区别）

浅谈pandas中Dataframe的查询方法([], loc, iloc, at, iat, ix)

python pandas.DataFrame选取、修改数据最好用.loc,.iloc,.ix实现

Pandas数据选取详解：df[], df.loc[], df.iloc[], df.ix[], df.at[], df.iat[]

Pandas DataFrame查询详解：loc, iloc, at, iat, ix

pandas的iloc、loc、.at、.iat区别

Python pandas DataFrame查询方法详解：[]、loc、iloc、at、iat、ix

使用Pandas处理数据：数据结构与基本操作

最新资源