dataframe的基本用法
时间: 2023-11-18 08:14:28 浏览: 79
DataFrame是Pandas库中的一个重要数据结构,它类似于Excel或SQL中的表格,是由多个行和列组成的二维数据结构。
下面是一些常用的DataFrame基本用法:
1. 创建DataFrame:
可以通过传入字典、列表等数据结构来创建DataFrame。例如:
```
import pandas as pd
# 通过字典创建DataFrame
data = {'name': ['Alice', 'Bob', 'Charlie', 'David'],
'age': [25, 30, 35, 40],
'gender': ['F', 'M', 'M', 'M']}
df = pd.DataFrame(data)
# 通过列表创建DataFrame
data = [['Alice', 25, 'F'], ['Bob', 30, 'M'], ['Charlie', 35, 'M'], ['David', 40, 'M']]
df = pd.DataFrame(data, columns=['name', 'age', 'gender'])
```
2. 访问数据:
通过列名或行索引访问DataFrame中的数据。例如:
```
# 访问列
df['name']
df.age
# 访问行
df.loc[0] # 通过行索引
df.iloc[0] # 通过行号
```
3. 筛选数据:
可以通过布尔索引或条件表达式来筛选DataFrame中的数据。例如:
```
# 通过布尔索引筛选
df[df.age > 30]
# 通过条件表达式筛选
df.query('age > 30')
```
4. 修改数据:
可以通过赋值操作或apply函数来修改DataFrame中的数据。例如:
```
# 修改列
df['age'] = df['age'] + 1
# 修改行
df.loc[0] = ['Amy', 20, 'F']
# 使用apply函数修改
df['age'] = df['age'].apply(lambda x: x + 1)
```
5. 合并数据:
可以通过concat、merge等函数来合并多个DataFrame。例如:
```
# 使用concat函数合并
df1 = pd.DataFrame({'name': ['Alice', 'Bob'], 'age': [25, 30]})
df2 = pd.DataFrame({'name': ['Charlie', 'David'], 'age': [35, 40]})
pd.concat([df1, df2])
# 使用merge函数合并
df1 = pd.DataFrame({'name': ['Alice', 'Bob'], 'age': [25, 30], 'gender': ['F', 'M']})
df2 = pd.DataFrame({'name': ['Alice', 'Charlie'], 'salary': [5000, 6000]})
pd.merge(df1, df2, on='name', how='outer')
```
这些是DataFrame的基本用法,Pandas还有很多高级功能和操作,可以根据具体需求进行学习和使用。
阅读全文