如何用python删除表格里制定列的重复数据并保留前三条
时间: 2024-02-25 08:57:42 浏览: 61
如何删除表中重复数据
如果要删除表格中指定列的重复数据并保留前三条,可以在 `drop_duplicates()` 方法中指定要保留的列名,具体代码如下:
```python
import pandas as pd
# 读取表格数据
df = pd.read_excel('data.xlsx')
# 指定要保留的列名
cols = ['列1', '列2', '列3']
# 删除重复数据并保留前三条
df.drop_duplicates(subset=cols, inplace=True)
df = df[:3]
# 将结果保存到新的表格中
df.to_excel('result.xlsx', index=False)
```
其中,`subset` 参数用于指定要保留的列名,可以是一个列表,`inplace=True` 表示直接在原表格上进行修改。最后,`to_excel()` 方法可以将结果保存到新的表格中,`index=False` 表示不保存行索引。
阅读全文