dataframe根据重复的列放到新的dataframe
时间: 2023-11-18 22:04:57 浏览: 176
可以使用pandas中的groupby方法来实现将重复的列放到新的dataframe中。
假设我们有以下的dataframe:
```
import pandas as pd
df = pd.DataFrame({
'name': ['Alice', 'Bob', 'Charlie', 'Alice', 'David', 'Bob'],
'age': [25, 30, 35, 25, 40, 30],
'salary': [50000, 60000, 70000, 50000, 80000, 60000]
})
print(df)
```
输出结果为:
```
name age salary
0 Alice 25 50000
1 Bob 30 60000
2 Charlie 35 70000
3 Alice 25 50000
4 David 40 80000
5 Bob 30 60000
```
我们想要将重复的name列放到新的dataframe中,可以使用以下代码:
```
df_new = df.groupby('name').first().reset_index()
print(df_new)
```
输出结果为:
```
name age salary
0 Alice 25 50000
1 Bob 30 60000
2 Charlie 35 70000
3 David 40 80000
```
其中,groupby方法会将dataframe按照指定的列进行分组,然后使用first方法取每组的第一行数据,最后使用reset_index方法将name列变为普通列。这样就可以得到一个新的dataframe,其中每个name都只出现一次。
阅读全文