pandas DataFrame详细讲解
时间: 2023-07-12 22:22:43 浏览: 23
Pandas DataFrame 是一个二维表格数据结构,类似于 Excel 表格或 SQL 数据库中的表格,可以存储和处理各种类型的数据。DataFrame 由行和列组成,每一列可以存储不同类型的数据(如数值、字符串、布尔值等),每一行都有一个唯一的索引值。
下面是 Pandas DataFrame 的一些常用操作:
1. 创建 DataFrame
可以通过读取文件、从数据库中查询、从 Python 数据结构中创建等方式来创建 DataFrame。例如,从 Python 字典中创建 DataFrame:
```python
import pandas as pd
data = {'name': ['Alice', 'Bob', 'Charlie', 'David'],
'age': [25, 30, 35, 40],
'gender': ['F', 'M', 'M', 'M']}
df = pd.DataFrame(data)
```
2. 查看 DataFrame
可以使用 head()、tail()、info() 和 describe() 等方法来查看 DataFrame 的内容和结构。例如,使用 head() 方法查看前几行数据:
```python
df.head()
```
输出结果如下:
```
name age gender
0 Alice 25 F
1 Bob 30 M
2 Charlie 35 M
3 David 40 M
```
3. 访问 DataFrame
可以使用 loc[] 和 iloc[] 属性来访问 DataFrame 中的数据。loc[] 属性可以通过行标签和列标签来访问数据,iloc[] 属性可以通过行索引和列索引来访问数据。例如,使用 loc[] 属性访问某一行数据:
```python
df.loc[1]
```
输出结果如下:
```
name Bob
age 30
gender M
Name: 1, dtype: object
```
4. 修改 DataFrame
可以使用 loc[] 和 iloc[] 属性来修改 DataFrame 中的数据。例如,使用 loc[] 属性修改某一行数据:
```python
df.loc[1, 'age'] = 31
```
5. 添加和删除行和列
可以使用 append() 方法添加新行,使用 drop() 方法删除行或列。例如,添加新行:
```python
new_row = {'name': 'Emily', 'age': 25, 'gender': 'F'}
df = df.append(new_row, ignore_index=True)
```
删除某一列:
```python
df.drop('gender', axis=1, inplace=True)
```
6. 数据的统计和分组
可以使用 groupby() 方法对 DataFrame 进行分组,使用 sum()、mean()、count() 等方法对数据进行统计。例如,对 age 列进行分组并计算平均值:
```python
df.groupby('age').mean()
```
输出结果如下:
```
name
age
25 Alice
30 Bob
31 Bob
35 Charlie
40 David
```
以上是 Pandas DataFrame 的一些常用操作,还有很多其他的操作和方法可以使用,可以根据具体需求进行学习和使用。
相关推荐


















