1.xlsx中的author列代表姓名,如果存在同名,将同名的数据保存为same.xlsx表格,不重名的则保存为unique.xlsx 用python处理
时间: 2024-04-13 15:30:49 浏览: 96
要实现将同名数据保存为一个表格(`same.xlsx`),不重名数据保存为另一个表格(`unique.xlsx`),可以使用 Python 中的 Pandas 库进行处理。下面是一个示例代码:
```python
import pandas as pd
# 读取原始数据
df = pd.read_excel("1.xlsx")
# 根据作者名进行分组
groups = df.groupby("author")
# 创建两个空的 DataFrame,用于存储同名和不重名数据
same_df = pd.DataFrame(columns=df.columns)
unique_df = pd.DataFrame(columns=df.columns)
# 遍历分组,根据作者名进行判断并存储数据
for author, group in groups:
if len(group) > 1: # 同名数据
same_df = same_df.append(group)
else: # 不重名数据
unique_df = unique_df.append(group)
# 保存同名和不重名数据到不同的表格
same_df.to_excel("same.xlsx", index=False)
unique_df.to_excel("unique.xlsx", index=False)
```
上述代码首先读取了名为 `1.xlsx` 的原始数据,并根据 `author` 列进行分组。接着,创建了两个空的 DataFrame 分别用于存储同名和不重名数据。然后,通过遍历分组,根据每个分组的长度判断是同名数据还是不重名数据,并将其存储到对应的 DataFrame 中。最后,将同名和不重名数据分别保存到 `same.xlsx` 和 `unique.xlsx` 表格中。
请确保在运行代码之前已经安装了 Pandas 库,并将 `1.xlsx` 文件准确放置在当前工作目录下。
阅读全文