DataFrame的创建及索引
时间: 2024-05-07 18:18:33 浏览: 68
DataFrame是Pandas中最重要的数据结构之一,它类似于一个二维表格,可以存储多种类型的数据,并且可以方便地进行数据处理和分析。
下面是创建DataFrame的几种方法:
1. 从列表创建DataFrame
```python
import pandas as pd
data = [['小明', 18], ['小红', 20], ['小刚', 22]]
df = pd.DataFrame(data, columns=['姓名', '年龄'])
print(df)
```
输出:
```
姓名 年龄
0 小明 18
1 小红 20
2 小刚 22
```
2. 从字典创建DataFrame
```python
import pandas as pd
data = {'姓名': ['小明', '小红', '小刚'], '年龄': [18, 20, 22]}
df = pd.DataFrame(data)
print(df)
```
输出:
```
姓名 年龄
0 小明 18
1 小红 20
2 小刚 22
```
3. 从CSV文件创建DataFrame
```python
import pandas as pd
df = pd.read_csv('data.csv')
print(df)
```
其中,data.csv是一个CSV格式的文件,内容如下:
```
姓名,年龄
小明,18
小红,20
小刚,22
```
DataFrame的索引有两种方式,一种是行索引,一种是列索引。
行索引可以使用iloc和loc方法进行访问。
- iloc:按照行号进行索引,从0开始。
```python
import pandas as pd
data = {'姓名': ['小明', '小红', '小刚'], '年龄': [18, 20, 22]}
df = pd.DataFrame(data)
print(df.iloc[1]) # 访问第2行数据
```
输出:
```
姓名 小红
年龄 20
Name: 1, dtype: object
```
- loc:按照行标签进行索引。
```python
import pandas as pd
data = {'姓名': ['小明', '小红', '小刚'], '年龄': [18, 20, 22]}
df = pd.DataFrame(data, index=['a', 'b', 'c'])
print(df.loc['b']) # 访问'b'行数据
```
输出:
```
姓名 小红
年龄 20
Name: b, dtype: object
```
列索引可以使用列名进行访问。
```python
import pandas as pd
data = {'姓名': ['小明', '小红', '小刚'], '年龄': [18, 20, 22]}
df = pd.DataFrame(data)
print(df['姓名']) # 访问'姓名'列数据
```
输出:
```
0 小明
1 小红
2 小刚
Name: 姓名, dtype: object
```
阅读全文