dataframe 迭代
时间: 2023-10-17 07:03:03 浏览: 77
DataFrame是Pandas库中最常用的数据结构之一,迭代DataFrame通常分为两种方式:按列迭代和按行迭代。
按列迭代指的是按照列的顺序逐个迭代DataFrame中的数据。可以使用DataFrame的columns属性获取列名列表,并通过for循环遍历每个列名,然后再使用列名作为索引访问DataFrame的每列数据。例如:
```
import pandas as pd
data = {'Name': ['Tom', 'Jack', 'Steve'], 'Age': [28, 32, 45], 'City': ['Beijing', 'Shanghai', 'Guangzhou']}
df = pd.DataFrame(data)
for column in df.columns:
column_data = df[column]
print(column_data)
```
输出结果为:
```
0 Tom
1 Jack
2 Steve
Name: Name, dtype: object
0 28
1 32
2 45
Name: Age, dtype: int64
0 Beijing
1 Shanghai
2 Guangzhou
Name: City, dtype: object
```
按行迭代指的是按照行的顺序逐个迭代DataFrame中的数据。可以使用DataFrame的iterrows()方法来实现行迭代,该方法返回一个生成器,每次迭代返回一个元组,其中包含行索引和行数据。例如:
```
import pandas as pd
data = {'Name': ['Tom', 'Jack', 'Steve'], 'Age': [28, 32, 45], 'City': ['Beijing', 'Shanghai', 'Guangzhou']}
df = pd.DataFrame(data)
for index, row in df.iterrows():
print(f'Index: {index}')
print(f'Row: {row}')
```
输出结果为:
```
Index: 0
Row: Name Tom
Age 28
City Beijing
Name: 0, dtype: object
Index: 1
Row: Name Jack
Age 32
City Shanghai
Name: 1, dtype: object
Index: 2
Row: Name Steve
Age 45
City Guangzhou
Name: 2, dtype: object
```
通过以上两种迭代方式,可以灵活地遍历DataFrame中的数据,根据需要进行数据处理和分析。
阅读全文