set_index用法及参数
时间: 2023-11-27 07:03:14 浏览: 84
set_index()是Pandas中用于将DataFrame的一列或多列设置为索引的函数。它可以接收一个或多个列名作为参数,并返回一个新的DataFrame对象,其中指定的列成为索引。
使用方法:
```python
df.set_index(keys, drop=True, append=False, inplace=False, verify_integrity=False)
```
参数说明:
- keys:要设置为索引的列名或列名的列表。
- drop:是否将列从DataFrame中删除。默认为True,即删除列。
- append:是否将新的索引列附加到现有索引列上。默认为False,即替换原有索引列。
- inplace:是否在原DataFrame对象上进行修改。默认为False,即返回一个新的DataFrame对象。
- verify_integrity:是否检查新的索引列是否唯一。默认为False,即不检查。
示例:
```python
import pandas as pd
# 创建一个DataFrame
data = {
'name': ['Alice', 'Bob', 'Charlie', 'David'],
'age': [25, 30, 35, 40],
'gender': ['F', 'M', 'M', 'M']
}
df = pd.DataFrame(data)
# 将name列设置为索引
df1 = df.set_index('name')
print(df1)
# 将name和gender列设置为复合索引
df2 = df.set_index(['name', 'gender'])
print(df2)
```
输出:
```
age gender
name
Alice 25 F
Bob 30 M
Charlie 35 M
David 40 M
age
name gender
Alice F 25
Bob M 30
Charlie M 35
David M 40
```
阅读全文