python 对列数据去重
时间: 2023-06-22 11:23:38 浏览: 140
可以使用 Python 中的 set() 函数对列表数据进行去重。例如,假设有一个列表 a = [1, 2, 2, 3, 3, 3, 4, 5, 5],要对其进行去重,可以使用以下代码:
```
a = [1, 2, 2, 3, 3, 3, 4, 5, 5]
a = list(set(a))
print(a)
```
输出结果为:[1, 2, 3, 4, 5],即成功将列表中的重复元素去除。
相关问题
python 对df列数据去重
可以使用 Pandas 库中的 drop_duplicates() 方法对 DataFrame 中的列数据进行去重。例如,假设有一个 DataFrame df,其中有一列数据需要去重,可以使用以下代码:
```
import pandas as pd
df = pd.DataFrame({'A': [1, 2, 2, 3, 3, 3, 4, 5, 5]})
df = df.drop_duplicates(subset=['A'])
print(df)
```
输出结果为:
```
A
0 1
1 2
3 3
6 4
7 5
```
即成功将 DataFrame 中的重复元素去除,并保留第一次出现的元素。其中,subset 参数指定要对哪些列进行去重,默认对所有列进行去重。
pandas对列数据去重
可以使用 `drop_duplicates()` 方法对 pandas 数据库中的列数据进行去重,例如:
```python
import pandas as pd
# 创建一个包含重复数据的 DataFrame
data = {'fruit': ['apple', 'banana', 'apple', 'orange', 'banana', 'banana'],
'count': [2, 3, 1, 4, 2, 1]}
df = pd.DataFrame(data)
# 对 'fruit' 列进行去重
df_fruit = df.drop_duplicates('fruit')
print(df_fruit)
```
输出结果为:
```
fruit count
0 apple 2
1 banana 3
3 orange 4
```
在这个例子中,我们先创建了一个包含重复数据的 DataFrame,然后使用 `drop_duplicates()` 方法对 'fruit' 列进行去重,最终得到一个仅包含不重复 'fruit' 列的 DataFrame。