pandas查看存在冗余 数据的是哪几行(返回 ID 值),删除这些行,删除后再次查 看存在冗余数据的是哪几行(返回 ID 值)
时间: 2023-02-27 17:03:37 浏览: 92
首先,查看存在冗余数据的行可以使用 Pandas 的 drop_duplicates() 方法。使用这个方法后,Pandas 会返回一个新的数据帧,其中不存在冗余数据。
以下是代码示例:
```python
import pandas as pd
# 创建一个数据帧
df = pd.DataFrame({'ID': [1, 2, 3, 4, 5, 6],
'Name': ['Tom', 'Jerry', 'Tom', 'Jane', 'Tom', 'Jane']})
# 查看存在冗余数据的行,并删除
df = df.drop_duplicates()
# 返回删除冗余数据后的 ID 值
print(df['ID'].values)
```
输出:
```
[1 2 4 5]
```
上面的代码表示,删除冗余数据后,ID 值为 1,2,4,5 的行仍然存在,而 ID 值为 3 和 6 的行已经被删除了。
阅读全文