写一个函数,这个函数处理了格式为xlsx的文件,我可以根据我的需要索引不同的列名,这些列的数据都是0或者1,然后返回由3个原数据为一组组成的列表
时间: 2024-12-22 14:13:14 浏览: 5
你可以创建一个Python函数,使用pandas库来处理xlsx文件。下面是一个简单的例子:
```python
import pandas as pd
def process_excel_file(file_path, column_names):
# 读取xlsx文件
df = pd.read_excel(file_path)
# 检查指定的列是否存在
if all(column_name in df.columns for column_name in column_names):
# 确保只有0和1的数据
filtered_df = df.loc[:, column_names].replace({True: 1, False: 0})
# 根据三个列名进行分组并转成列表
grouped_data = filtered_df.groupby(list(column_names)).size().tolist()
return grouped_data
else:
raise ValueError(f"部分列名 {column_names} 不存在于文件中")
# 使用示例
file_path = 'example.xlsx'
columns_of_interest = ['ColumnA', 'ColumnB', 'ColumnC']
result = process_excel_file(file_path, columns_of_interest)
print(result)
阅读全文