DataFrame如何设置索引,不同的组别,重新定义索引从0开始。python代码
时间: 2024-03-16 13:46:29 浏览: 121
可以使用pandas库来设置DataFrame的索引,不同的组别可以通过reset_index()方法重新定义索引。具体的代码如下所示:
```python
import pandas as pd
# 构造数据
data = {
'category': ['A', 'B', 'A', 'C', 'B', 'C'],
'value': [1, 2, 3, 4, 5, 6]
}
df = pd.DataFrame(data)
# 设置索引并重新定义索引
df = df.set_index('category')
grouped = df.groupby('category')
for name, group in grouped:
print("category:", name)
print(group.reset_index(drop=True))
```
运行结果如下:
```
category: A
value
0 1
1 3
category: B
value
0 2
1 5
category: C
value
0 4
1 6
```
上述代码中,首先构造了一个DataFrame对象,其中包含了两列数据,一列是类别(category),另一列是数值(value)。然后使用set_index()方法将'category'列设置为索引,接着使用groupby()方法对DataFrame进行分组统计,其中'category'参数指定按照类别进行分组,并且使用for循环遍历分组后的结果,输出每个组的数据明细。其中,name表示当前组的类别名称,group表示当前组的数据明细,使用reset_index()方法可以重置行索引,使用drop参数设置为True可以删除原来的行索引。
阅读全文