sort_values参数详解
时间: 2024-11-09 20:20:51 浏览: 20
`sort_values()` 是 pandas 库中的一个函数,用于对 DataFrame 或 Series 进行排序。这个函数可以根据指定的列或多列的值进行升序(默认)或降序排列。以下是 `sort_values` 函数的一些关键参数详解:
1. **by**: 必需参数,它决定了按哪些列或键进行排序。可以是一个字符串(表示列名)、列表或数组(表示多个列),或者是 Series 对象。
```python
df.sort_values(by='column_name') # 单列排序
df.sort_values(by=['col1', 'col2']) # 多列排序,先按 col1 排,再按 col2 排
```
2. **ascending** 或 **asc**: 可选参数,默认为 True,控制排序顺序。如果设置为 False,则会进行降序排列。
```python
df.sort_values(by='col', ascending=False) # 按 col 列降序排列
```
3. **inplace**: 可选参数,默认为 False,如果设置为 True,会对原始 DataFrame 执行就地排序,不会返回新的 DataFrame。
```python
df.sort_values(by='col', inplace=True) # 就地修改 DataFrame
```
4. **kind**: 可选参数,指定排序算法。常见的有 "quicksort"(默认)、"mergesort" 和 "heapsort" 等。
5. **na_position**: 可选参数,处理缺失值的方式。有 "first"(将缺失值排在前面)、"last"(将它们排在最后)或 "top" 和 "bottom"。
```python
df.sort_values(by='col', na_position='last') # 把缺失值放在最后
```
6. **ignore_index**: 可选参数,默认为 False,如果设置为 True,在排序后会创建一个新的索引,从0开始计数。
```python
df.sort_values(by='col', ignore_index=True) # 排序后重置索引
```
阅读全文