dataframe根据重复的列,将重读的列放到新的dataframe
时间: 2024-05-11 07:14:55 浏览: 108
spark dataframe 将一列展开,把该列所有值都变成新列的方法
可以使用pandas的`duplicated`函数和`loc`属性来实现。以下是示例代码:
```python
import pandas as pd
# 创建示例数据
data = {'A': [1, 2, 3, 4, 4, 5, 6],
'B': ['a', 'b', 'c', 'd', 'd', 'e', 'f'],
'C': [10, 20, 30, 40, 40, 50, 60]}
df = pd.DataFrame(data)
# 找到重复的数据
duplicated = df[df.duplicated(subset='A', keep=False)]
# 将重复的数据放到新的dataframe中
new_df = duplicated.loc[:, ['A', 'B', 'C']]
```
在此示例中,我们创建了一个包含重复值的DataFrame,然后使用`duplicated`函数找到重复的行。然后,我们使用`loc`属性选择'A'、'B'和'C'列,并将它们放入一个新的DataFrame中。
阅读全文