对1.xlsx进行分析,如果author列的数据相同,就去对比org列,如果都相同,将author相同且org也相同的数据导出为2.xlsx
时间: 2024-04-13 16:31:00 浏览: 131
查找两列数据异同.xlsm
5星 · 资源好评率100%
要对 `1.xlsx` 文件进行分析,如果 `author` 列的数据相同且对应的 `org` 列也相同,将这些数据导出到 `2.xlsx` 中,可以使用 Python 中的 Pandas 库进行处理。以下是一个示例代码:
```python
import pandas as pd
# 读取原始数据
df = pd.read_excel("1.xlsx")
# 根据 author 和 org 列进行分组
groups = df.groupby(["author", "org"])
# 创建空的 DataFrame,用于存储满足条件的数据
result_df = pd.DataFrame(columns=df.columns)
# 遍历分组,根据条件进行筛选并存储数据
for (author, org), group in groups:
if len(group) > 1: # author 和 org 都相同的数据
result_df = result_df.append(group)
# 保存满足条件的数据到 2.xlsx
result_df.to_excel("2.xlsx", index=False)
```
上述代码首先读取了名为 `1.xlsx` 的原始数据,并根据 `author` 和 `org` 列进行分组。然后,创建一个空的 DataFrame 用于存储满足条件的数据。接下来,通过遍历分组,判断每个分组的长度,如果大于1,则表示 `author` 和 `org` 都相同的数据,将其追加到结果 DataFrame 中。最后,将满足条件的数据保存到名为 `2.xlsx` 的表格中。
请确保在运行代码之前已经安装了 Pandas 库,并将 `1.xlsx` 文件准确放置在当前工作目录下。
阅读全文