pandas set_index
时间: 2023-10-08 19:11:40 浏览: 129
`set_index` 是 pandas 中的一个函数,用于将一个或多个列设置为索引,并返回一个新的 DataFrame。
语法如下:
```python
df.set_index(keys, drop=True, append=False, inplace=False, verify_integrity=False)
```
参数说明:
- `keys`:可以是一个或多个列名,用于设置为索引。如果是多个列名,需要以列表的形式传入。
- `drop`:默认为 True,表示将被设置为索引的列从 DataFrame 中删除。如果设置为 False,那么这些列仍然会保留在 DataFrame 中。
- `append`:默认为 False,表示新的索引将覆盖现有的索引。如果设置为 True,那么新的索引将追加到现有的索引之后。
- `inplace`:默认为 False,表示返回一个新的 DataFrame。如果设置为 True,那么直接在原始 DataFrame 上进行操作。
- `verify_integrity`:默认为 False,表示不检查新的索引是否唯一。如果设置为 True,那么会检查新的索引是否唯一,如果存在重复,会抛出异常。
示例:
```python
import pandas as pd
# 创建一个 DataFrame
data = {
'name': ['张三', '李四', '王五'],
'gender': ['男', '男', '女'],
'age': [20, 25, 30]
}
df = pd.DataFrame(data)
# 设置 'name' 为索引
df = df.set_index('name')
print(df)
```
输出结果:
```
gender age
name
张三 男 20
李四 男 25
王五 女 30
```
阅读全文