pandas读取excel表格,检测A B C三列是否有重复的行
时间: 2024-11-13 16:23:30 浏览: 17
解决python pandas读取excel中多个不同sheet表格存在的问题
5星 · 资源好评率100%
要使用Pandas读取Excel表格并检测A、B、C三列是否有重复的行,可以按照以下步骤进行:
1. **导入所需库**[^1]:
```python
import pandas as pd
```
2. **读取Excel文件**:
```python
df = pd.read_excel("test.xlsx", engine="openpyxl", sheet_name="表1")
```
3. **选择特定列**:
为了检查A、B、C列,需要创建一个包含这些列索引的列表,假设它们的索引分别是0、1和2:
```python
cols_of_interest = [0, 1, 2]
```
4. **合并选定列的数据**:
```python
selected_df = df.iloc[:, cols_of_interest] # 切片选取列
```
5. **删除重复行**:
使用`drop_duplicates()`函数去除重复行,如果发现有重复,则返回False,表示存在重复:
```python
has_duplicates = selected_df.duplicated(subset=cols_of_interest).any()
```
6. **打印结果**:
```python
if has_duplicates:
print("A、B、C列中有重复的行")
else:
print("A、B、C列中没有重复的行")
```
阅读全文