用python代码实现,将A列、B列、C列字符串用下划线连接生成D列,再用下划线将D列分割为列表并对列表内的元素去重得到E列
时间: 2024-03-12 19:47:37 浏览: 89
好的,下面是示例代码,假设我们有一个 DataFrame 对象,其中包含 A 列、B 列和 C 列:
```python
import pandas as pd
# 创建示例数据
data = {
'A': ['foo', 'hello', 'spam'],
'B': ['bar', 'world', 'eggs'],
'C': ['apple', 'banana', 'apple']
}
# 创建 DataFrame 对象
df = pd.DataFrame(data)
# 将 A 列、B 列、C 列字符串用下划线连接生成 D 列
df['D'] = df.apply(lambda row: '_'.join([row['A'], row['B'], row['C']]), axis=1)
# 用下划线将 D 列分割为列表并对列表内的元素去重得到 E 列
df['E'] = df['D'].apply(lambda x: list(set(x.split('_'))))
# 打印处理后的 DataFrame 对象
print(df)
```
运行结果如下:
```
A B C D E
0 foo bar apple foo_bar_apple [apple, foo, bar]
1 hello world banana hello_world_banana [banana, hello, world]
2 spam eggs apple spam_eggs_apple [eggs, spam, apple]
```
这个代码中,我们使用 apply() 函数将 A 列、B 列、C 列字符串用下划线连接生成 D 列。然后,我们使用 apply() 函数将 D 列字符串用下划线分割为列表并对列表内的元素去重,得到了 E 列。
阅读全文