dataframe如何筛选出独特的列
时间: 2024-09-28 17:09:38 浏览: 24
使用DataFrame删除行和列的实例讲解
在Pandas DataFrame中,如果你想筛选出独特的列,也就是只保留每一列不重复的元素,可以按照以下步骤操作:
1. 首先,你需要确定你要筛选的列名,假设你想查看的是`df`数据框中的所有列:
```python
columns = df.columns.tolist() # 获取数据框的所有列名
```
2. 然后,你可以对每个列应用`drop_duplicates()`方法,这个方法会返回一个只包含唯一行的新DataFrame。如果希望保持原数据框不变,可以使用`duplicated()`函数判断并标记哪些行有重复,再通过布尔索引来选择不重复的行:
```python
for col in columns:
df[col] = df[col].drop_duplicates()
```
或者
```python
for col in columns:
mask = ~df.duplicated(subset=col) # 标记不重复的行
df = df[mask]
```
3. 最后,得到的`df`就是只包含每列独特元素的DataFrame。
阅读全文