用pyhon pandas将excel中整行一样的数据去重
时间: 2024-05-07 21:15:11 浏览: 105
可以使用pandas库中的drop_duplicates方法实现去除整行一样的数据。
假设有一个excel文件名为data.xlsx,其中有一个名为Sheet1的工作表,我们可以使用以下代码读取该工作表的数据,并去除整行一样的数据:
```python
import pandas as pd
# 读取excel文件
df = pd.read_excel('data.xlsx', sheet_name='Sheet1')
# 去除整行一样的数据
df.drop_duplicates(inplace=True)
# 将去重后的数据写入新的excel文件
df.to_excel('new_data.xlsx', index=False)
```
在上述代码中,我们首先使用pd.read_excel方法读取excel文件中的数据,然后使用drop_duplicates方法去除整行一样的数据。最后,使用to_excel方法将去重后的数据写入新的excel文件。注意,inplace=True表示在原始数据上进行修改,而index=False表示不将行索引写入到新的excel文件中。
阅读全文