dataframe类型数据的遍历_pandas 常用的数据处理函数
时间: 2023-12-10 12:40:13 浏览: 97
在 Pandas 中,DataFrame 是一个二维的表格型数据结构,可以看作是由多个 Series 组成的字典。遍历 DataFrame 数据可以使用以下方法:
1. 使用 for 循环遍历每一行数据:
```python
import pandas as pd
# 创建一个 DataFrame
data = {'name': ['Tom', 'Jack', 'Mary'], 'age': [18, 20, 22]}
df = pd.DataFrame(data)
# 遍历每一行数据
for index, row in df.iterrows():
print(row['name'], row['age'])
```
2. 使用 apply() 函数遍历每一列数据:
```python
import pandas as pd
# 创建一个 DataFrame
data = {'name': ['Tom', 'Jack', 'Mary'], 'age': [18, 20, 22]}
df = pd.DataFrame(data)
# 遍历每一列数据
def print_col(col):
print(col.name, col.values)
df.apply(print_col)
```
常用的 Pandas 数据处理函数包括:
1. dropna():删除包含缺失值的行或列。
2. fillna():用指定值或方法填充缺失值。
3. replace():替换指定值。
4. groupby():按照指定列进行分组。
5. pivot_table():创建透视表。
6. merge():合并多个 DataFrame。
7. sort_values():按照指定列进行排序。
等等。
阅读全文