pandas库dataframe
时间: 2023-07-07 09:44:38 浏览: 98
`pandas` 是一个广泛使用的数据处理库,其中最重要的数据结构是 `DataFrame`。 `DataFrame` 是一个二维的标签数组,它可以存储多种类型的数据,并且可以通过行和列的名称进行索引。 `DataFrame` 可以从多种数据源创建,例如 CSV 文件、数据库查询、Excel 文件和 Python 数据结构等。
下面是一个使用 `pandas` 库创建、修改和操作 `DataFrame` 的简单示例:
```python
import pandas as pd
# 创建DataFrame
data = {'name': ['Alice', 'Bob', 'Charlie', 'David'],
'age': [25, 30, 35, 40],
'gender': ['F', 'M', 'M', 'M']}
df = pd.DataFrame(data)
# 展示DataFrame
print(df)
# 访问DataFrame列
print(df['name'])
# 访问DataFrame行
print(df.iloc[0])
# 添加新列
df['salary'] = [5000, 6000, 7000, 8000]
print(df)
# 删除列
df = df.drop(columns=['gender'])
print(df)
# 修改行
df.iloc[0] = ['Alice', 26, 5500]
print(df)
# 修改单元格
df.at[1, 'age'] = 31
print(df)
# 过滤行
df_filtered = df[df['age'] >= 35]
print(df_filtered)
```
输出:
```
name age gender
0 Alice 25 F
1 Bob 30 M
2 Charlie 35 M
3 David 40 M
0 Alice
1 Bob
2 Charlie
3 David
Name: name, dtype: object
name Alice
age 25
gender F
Name: 0, dtype: object
name age gender salary
0 Alice 25 F 5000
1 Bob 30 M 6000
2 Charlie 35 M 7000
3 David 40 M 8000
name age salary
0 Alice 25 5000
1 Bob 30 6000
2 Charlie 35 7000
3 David 40 8000
name age salary
0 Alice 26 5500
1 Bob 30 6000
2 Charlie 35 7000
3 David 40 8000
name age salary
0 Alice 26 5500
1 Bob 31 6000
2 Charlie 35 7000
3 David 40 8000
name age salary
2 Charlie 35 7000
3 David 40 8000
```
在上面的示例中,我们首先创建了一个包含学生姓名、年龄和性别的字典,然后使用该字典创建了一个 `DataFrame`。
我们可以使用 `print(df)` 显示整个 `DataFrame`,使用 `df['name']` 访问 `name` 列,使用 `df.iloc[0]` 访问第一行,等等。
我们还可以添加新的列 `salary`,删除 `gender` 列,修改第一行中的值,修改单元格的值,以及使用过滤器过滤数据行。
这只是 `pandas` 库中 `DataFrame` 的一部分功能,还有很多其他的操作和功能可用。
阅读全文