pandas读取excel表格,提取A B C三列中重复的行到同一表格
时间: 2024-11-13 15:23:54 浏览: 10
Python导入Excel
要使用Pandas读取Excel表格并提取A、B、C三列中重复的行到同一表格,可以按照以下步骤操作:
1. 首先,导入所需的库:
```python
import pandas as pd
```
2. 使用`read_excel`函数读取Excel文件,并指定需要的列(这里假设文件名为'data.xlsx'):
```python
# 如果只读取A、B、C列
data = pd.read_excel('data.xlsx', usecols=['A', 'B', 'C'])
```
3. 对这些列应用`duplicated`函数以查找重复行,设置参数`keep=False`以保留所有重复行:
```python
# 查找重复行
duplicates = data.duplicated(subset=['A', 'B', 'C'], keep=False)
```
4. 将找到的重复行索引存储在一个新DataFrame中:
```python
# 创建一个新的DataFrame,仅包含重复行
repeated_rows = data[duplicates]
```
5. 最后,你可以选择保存这个新DataFrame到新的Excel文件,保持相同的列顺序:
```python
# 写入新的Excel文件,合并重复的行
with pd.ExcelWriter('output.xlsx') as writer:
repeated_rows.to_excel(writer, sheet_name='Repeating Rows', merge_cells=True)
```
这样,你就得到了一个新的Excel文件,其中包含了原文件中A、B、C列中的重复行。
阅读全文