首页pandas groupby多条件分组以及排序顺序

pandas groupby多条件分组以及排序顺序

时间: 2023-11-12 11:00:30 浏览: 354

pandas多级分组实现排序的方法

pandas有groupby分组函数和sort_values排序函数，但是如何对dataframe分组之后排序呢？ In [70]: df = pd.DataFrame(((random.randint(2012, 2016), random.choice(['tech', 'art', 'office']), '%dk-%dk'%(random.randint(2,10), random.randint(10, 20)), '') for _ in xrange(10000)), columns=['publish_time', 'classf', 'salary', 'title'])

Pandas 的 groupby 方法允许我们按照多个条件进行分组，可以通过将多个列名传递给 groupby 方法来实现。例如，假设我们有一个数据集 df，其中包含列 A、B、C 和 D，我们可以按照 A 和 B 列进行分组： ```python grouped = df.groupby(['A', 'B']) ``` 如果要按照多个条件进行分组，并且希望在每个分组内按照特定的顺序进行排序，可以使用 sort_values 方法。例如，以下代码将按照 A、B 和 C 列进行分组，并在每个分组内按照 D 列进行排序： ```python grouped = df.groupby(['A', 'B', 'C']).apply(lambda x: x.sort_values(['D'], ascending=False)) ``` 在这里，我们使用了 apply 方法来对每个分组内的数据进行排序。由于 sort_values 方法返回一个 DataFrame，因此需要使用 apply 方法将其应用于每个分组内的数据。在 sort_values 方法中，我们将 ascending 参数设置为 False，以确保按照逆序进行排序。注意，在使用多个条件进行分组时，列名的顺序非常重要。例如，对于分组列表 ['A', 'B'] 和 ['B', 'A']，结果将是不同的，因为分组的顺序不同。

阅读全文