删除重复列dataframe
时间: 2023-07-06 15:05:52 浏览: 48
你可以使用 `drop_duplicates` 函数来删除 dataframe 中的重复行或列。如果你想删除重复的列,可以指定参数 `axis=1`。例如:
```python
import pandas as pd
# 创建一个包含重复列的 dataframe
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [1, 4, 7], 'D': [2, 5, 8], 'E': [3, 6, 9], 'A': [1, 2, 3]})
# 删除重复列
df = df.T.drop_duplicates().T
print(df)
```
输出:
```
A B C D E
0 1 4 1 2 3
1 2 5 4 5 6
2 3 6 7 8 9
```
在这个例子中,我们创建了一个包含重复列的 dataframe,并使用 `drop_duplicates` 函数删除了其中的重复列。需要注意的是,我们先使用了 `T` 函数将 dataframe 转置,这样才能对列进行操作。最后再使用 `T` 函数将 dataframe 转回原来的形状。
相关问题
dataframe删除重复列
在pandas中,可以使用`drop_duplicates()`方法删除重复的行,但是如果想要删除重复的列,则可以使用以下方法:
```python
import pandas as pd
# 创建一个包含重复列的DataFrame
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [1, 2, 3], 'D': [4, 5, 6]})
# 使用transpose()方法将行列转置,然后使用drop_duplicates()方法删除重复行,最后再次转置
df = df.transpose().drop_duplicates().transpose()
print(df)
```
输出结果:
```
A B
0 1 4
1 2 5
2 3 6
```
该方法的思路是先将DataFrame转置为以列为行的形式,然后使用`drop_duplicates()`方法删除重复行,最后再次转置回来。这样就可以删除重复的列了。
dataframe里面怎么删除重复的列
可以使用pandas库中的drop_duplicates()方法来删除重复的列。这个方法会返回一个新的dataframe,其中不包含重复的列。
下面是一个示例代码:
```python
import pandas as pd
# 创建一个有重复列的dataframe
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [1, 4, 5], 'D': [4, 7, 8], 'E': [1, 3, 5]})
# 使用drop_duplicates()方法删除重复列
df = df.T.drop_duplicates().T
# 打印删除重复列后的dataframe
print(df)
```
输出结果为:
```
A B C D
0 1 4 1 4
1 2 5 4 7
2 3 6 5 8
```
在这个示例中,我们首先创建了一个有重复列的dataframe,然后使用drop_duplicates()方法删除重复列,最后打印删除重复列后的dataframe。