df列按照包含关键字['工资', '奖金', '离补', '.']的先后顺序排序
时间: 2023-09-23 18:13:24 浏览: 44
可以使用pandas的sort_values方法,其中key参数可以传入一个lambda函数来指定排序规则。具体实现代码如下:
```python
import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3],
'B': ['工资:1000.00, 离补:200.00', '奖金:500.00, 工资:1200.00, 离补:300.00', '离补:100.00, 工资:800.00']},
index=['a', 'b', 'c'])
df['match'] = df['B'].apply(lambda x: sum([1 for k in ['工资', '奖金', '离补', '.'] if k in x]))
df = df.sort_values(by=['match'], key=lambda x: x.str.find(['工资', '奖金', '离补', '.']))
df = df.drop(columns=['match'])
```
解释一下,首先在原始数据的基础上新增一个'match'列,表示每个字符串中包含关键字的数量。然后使用sort_values方法,按照先后顺序排序。其中key参数指定一个lambda函数,用来指定排序规则。这里的lambda函数中使用了pandas的str.find方法,按照关键字的先后顺序查找,并返回第一个找到的关键字的位置,然后使用这个位置来进行排序。最后再把新增的'match'列删除即可。
相关问题
给DF分组后按照包含关键字['工资', '离补', '奖金', '差异']的表名排序print
假设你已经将所有数据表的名称存储在一个名为 `table_names` 的列表中,并且你已经将这些表名按照 DF 数据库中的默认顺序进行了排序。下面是一种实现方式:
```python
# 定义包含关键字的列表
keywords = ['工资', '离补', '奖金', '差异']
# 定义一个空列表,用于存储包含关键字的表名
relevant_tables = []
# 遍历每个表名
for table_name in table_names:
# 如果表名包含任一关键字,就将其添加到 relevant_tables 列表中
if any(keyword in table_name for keyword in keywords):
relevant_tables.append(table_name)
# 将 relevant_tables 列表按照字母顺序进行排序
relevant_tables.sort()
# 输出结果
print(relevant_tables)
```
这段代码首先定义了一个包含关键字的列表。然后,它创建了一个空列表 `relevant_tables`,用于存储包含关键字的表名。接下来,它遍历所有表名,并检查每个表名是否包含任一关键字。如果是,就将该表名添加到 `relevant_tables` 列表中。最后,代码使用 `sort()` 方法按照字母顺序对 `relevant_tables` 列表进行排序,并将排序后的结果打印出来。
python有没有df分组后 group sort 函数,可以根据group中的表名中包含的关键字(工资、奖金、离补和差异)的固定顺序把每个df排序
是的,你可以使用 Pandas 库中的 groupby 和 apply 方法来实现这个功能。首先,使用 groupby 将 DataFrame 按照指定的列进行分组,然后使用 apply 将每个分组中的 DataFrame 进行排序。下面是一个示例代码:
```python
import pandas as pd
# 创建一个示例 DataFrame
data = {'name': ['Tom', 'Jerry', 'Bob', 'Alice', 'Emma', 'John'],
'salary': [5000, 6000, 8000, 7000, 9000, 10000],
'bonus': [2000, 1500, 3000, 2500, 4000, 5000],
'allowance': [1000, 800, 1200, 1100, 1300, 1500],
'difference': [500, 400, 600, 550, 650, 700]}
df = pd.DataFrame(data)
# 定义排序规则
order = ['salary', 'bonus', 'allowance', 'difference']
# 定义排序函数
def sort_group(group):
return group.sort_values(by=order)
# 按照关键字分组并排序
result = df.groupby(df.columns.str.contains('|'.join(order)), axis=1) \
.apply(sort_group).reset_index(drop=True)
print(result)
```
在这个示例代码中,我们首先定义了要排序的关键字顺序(即 `order` 列表)。然后,使用 Pandas 的 `groupby` 方法将 DataFrame 按照包含关键字的列进行分组。`df.columns.str.contains('|'.join(order))` 用于判断每列是否包含关键字,并返回一个布尔型的 DataFrame。最后,使用 `apply` 方法将每个分组中的 DataFrame 进行排序,并使用 `reset_index` 方法将索引重置为默认值。