我有一个路径为 D:\E\JunzhiTable 的名为 IDandUP.xlsx 的excel表格,内有两列数据,第一列和第二列的值有重复,我需要把第一列中和第二列重复的值删除,输出删除后的所有值并统计输出了几个值,应该怎么写
时间: 2024-02-11 22:09:09 浏览: 71
你可以使用 Python 中的 pandas 库来实现这个功能。以下是一段示例代码:
```python
import pandas as pd
# 读取 Excel 文件
df = pd.read_excel('D:\E\JunzhiTable\IDandUP.xlsx')
# 删除第一列中和第二列重复的值
df = df.drop_duplicates(subset=[df.columns[0]], keep=False)
# 输出删除后的所有值
print(df[df.columns[0]].tolist())
# 统计输出了几个值
print(f"输出了 {len(df)} 个值")
```
这段代码中,我们首先使用 `pd.read_excel()` 方法读取 Excel 文件,然后使用 `drop_duplicates()` 方法删除第一列中和第二列重复的值,并且保留不重复的值。最后,我们使用 `tolist()` 方法将删除后的所有值转换为列表,并使用 `len()` 方法统计输出了几个值。
相关问题
我有一个路径为 D:\E\JunzhiTable 的名为 IDandUP.xlsx 的excel表格,内有两列数据,第一列和第二列的值有重复,我需要把第一列中和第二列重复的值删除,输出删除后的所有值生成一个excel表,结果记录在第一列,每一行记录一个值,将这个excel表放在路径 D:\E\JunzhiTable,命名为TerminalLake.xlsx , 应该怎么写
你可以使用Python中的pandas库来实现这个功能,具体代码如下:
```python
import pandas as pd
# 读取excel文件
df = pd.read_excel(r"D:\E\JunzhiTable\IDandUP.xlsx")
# 删除第一列中和第二列重复的值
df = df.drop_duplicates(subset=[df.columns[0]],keep=False)
# 输出删除后的所有值并生成excel表
df.to_excel(r"D:\E\JunzhiTable\TerminalLake.xlsx", index=False, header=None)
```
以上代码会将IDandUP.xlsx文件读入到pandas的DataFrame中,然后在DataFrame中删除第一列中和第二列重复的值,并将结果输出到TerminalLake.xlsx文件中。
阅读全文