4. 现有如下图所示的表格数据,从前向后查找和判断是否有重复的数据并将重复值删除。 id name age height gender 0 1 小铭 18 180 女 1 2 小月 18 180 女 2 3 彭岩 29 185 男 3 4 刘华 58 175 男 4 5 周华 36 178 男 5 4 刘华 58 175 男
时间: 2024-03-08 09:50:07 浏览: 23
可以使用 Pandas 库来处理表格数据,以下是一个示例代码,展示如何对表格数据进行去重操作:
```python
import pandas as pd
# 定义数据表格
data = {
'id': [1, 2, 3, 4, 5, 4],
'name': ['小铭', '小月', '彭岩', '刘华', '周华', '刘华'],
'age': [18, 18, 29, 58, 36, 58],
'height': [180, 180, 185, 175, 178, 175],
'gender': ['女', '女', '男', '男', '男', '男']
}
df = pd.DataFrame(data)
# 去重操作
df.drop_duplicates(inplace=True)
# 打印结果
print(df)
```
在这个示例代码中,我们首先定义了一个数据字典 `data`,其中包含了表格数据。然后,我们使用 Pandas 的 `DataFrame` 类来将数据转换为数据框对象 `df`。接下来,我们使用 `drop_duplicates` 函数对数据框进行去重操作,将重复的行删除。最后,我们打印了去重后的结果。
需要注意的是,我们在去重操作时使用了 `inplace=True`,表示直接在原始数据框上进行修改,而不是返回一个新的数据框。如果不使用 `inplace=True`,则需要将去重后的数据框重新赋值给原始数据框。