首页df = pd.DataFrame({'col1': ['A', 'A', 'B', 'B', 'C'], 'col2': [1, 2, 3, 4, 5]}) 怎么让col1重复项只展示一次 col1的5个元素都展示

df = pd.DataFrame({'col1': ['A', 'A', 'B', 'B', 'C'], 'col2': [1, 2, 3, 4, 5]}) 怎么让col1重复项只展示一次 col1的5个元素都展示

时间: 2023-07-16 17:15:23 浏览: 92

详解pandas使用drop_duplicates去除DataFrame重复项参数

Pandas之drop_duplicates：去除重复项方法 DataFrame.drop_duplicates(subset=None, keep='first', inplace=False) 参数这个drop_duplicate方法是对DataFrame格式的数据，去除特定列下面的重复行。返回DataFrame格式的数据。 subset : column label or sequence of labels, optional 用来指定特定的列，默认所有列 keep : {‘first’, ‘last’, False}, default ‘first’ 删除重复项并

可以使用 `drop_duplicates` 方法去除 `col1` 的重复项，然后使用 `groupby` 和 `apply` 方法将每个组内的 `col2` 值合并为一个列表。示例如下： ```python import pandas as pd df = pd.DataFrame({'col1': ['A', 'A', 'B', 'B', 'C'], 'col2': [1, 2, 3, 4, 5]}) # 去除 col1 的重复项 df_unique_col1 = df.drop_duplicates(subset=['col1']) # 对每个组内的 col2 值进行合并 df_result = df.groupby('col1')['col2'].apply(list).reset_index() # 将去重后的 col1 列与合并后的 col2 列合并 df_result = pd.merge(df_unique_col1['col1'], df_result, on='col1', how='left') print(df_result) ``` 输出结果： ``` col1 col2 0 A [1, 2] 1 B [3, 4] 2 C [5] ``` 其中，`[1, 2]` 表示 `col1` 为 `A` 的两个行的 `col2` 值分别为 `1` 和 `2`，依次类推。

阅读全文