r 删除数据集中相同的列,留一列
时间: 2024-02-22 21:57:02 浏览: 128
删除数据库中重复的数据(只保留一条)
4星 · 用户满意度95%
你可以使用 pandas 库中的 drop_duplicates() 方法来删除数据集中相同的列,留一列。具体实现可以如下:
假设数据集名称为 df,列名为 col1、col2、col3,你想要删除 col2 和 col3 这两列,留下 col1 这一列,代码如下所示:
```
df = df.drop_duplicates(subset=['col1'], keep='first')[['col1']]
```
其中,subset 参数表示需要去重的列名,keep 参数表示保留哪个重复的值(这里选择保留第一个),最后的方括号中是保留的列名。
注意:这样的做法只是删除了相同的行,留下了其中的一个。如果你需要删除相同的列,留下其中的一个,可以对数据集进行转置后使用上述方法。
阅读全文