DataFrame 排序
时间: 2024-10-25 07:12:24 浏览: 61
在Pandas库中,DataFrame是一个二维表格型的数据结构,它支持多种排序操作。主要有以下几种方法对DataFrame进行排序:
1. **基于列名**:通过列名直接进行排序,默认按照升序排列:
```python
df_sorted = df.sort_values(by='column_name')
```
如果想要降序排列,可以设置`ascending=False`:
```python
df_sorted = df.sort_values(by='column_name', ascending=False)
```
2. **基于索引**:如果想要按照行索引(index)进行排序,可以指定`level=0`:
```python
df_sorted = df.sort_index()
df_sorted = df.sort_index(ascending=False)
```
3. **复合排序**:如果你想按多个列排序,可以在`by`参数中传递一个列表:
```python
df_sorted = df.sort_values(by=['column1', 'column2'], ascending=[True, False])
```
4. **稳定性排序**:对于有重复值的情况,Pandas的`sort_values`默认是非稳定的排序,即相等的元素可能会改变相对位置。如果你想得到稳定排序,可以使用`sort_index`和`sort_values`的`inplace=True`选项,并结合`numpy.argsort`来手动进行稳定排序。
排序完成后,`df_sorted`将是一个新的DataFrame,原DataFrame不会发生变化。如果想就地修改原有DataFrame,可以设置`inplace=True`。
阅读全文