python访问路径下所有excel文件,统计sheet_name=“功能点拆分表”excel列名为“子过程描述颜色”的列,对里面的内容进行分类计数,并全部写入新的excel中
时间: 2024-03-28 19:42:32 浏览: 117
Python中_name==_main的解释
好的,我可以帮你解决这个问题。首先,你需要安装 `pandas` 和 `xlrd` 这两个 Python 库,可以使用以下命令进行安装:
```
pip install pandas
pip install xlrd
```
接下来,你可以使用以下代码来实现:
```python
import os
import pandas as pd
# 定义访问路径和要查找的文件类型
path = '/your/path/to/excel/files'
filetype = '.xlsx'
# 定义要统计的列名和文件名
col_name = '子过程描述颜色'
output_file = 'output.xlsx'
# 遍历目录下的所有文件
result = {}
for root, dirs, files in os.walk(path):
for file in files:
if file.endswith(filetype):
# 读取 Excel 文件
file_path = os.path.join(root, file)
df = pd.read_excel(file_path, sheet_name='功能点拆分表')
# 统计子过程描述颜色列的值
if col_name in df.columns:
for value in df[col_name]:
if value not in result:
result[value] = 1
else:
result[value] += 1
# 将统计结果写入新的 Excel 文件中
output_df = pd.DataFrame.from_dict(result, orient='index', columns=['count'])
output_df.to_excel(output_file)
```
这段代码会遍历指定路径下的所有 Excel 文件,读取其中指定的 sheet_name 和列名,统计其值的出现次数,并将结果写入新的 Excel 文件中。
你可以根据需要修改代码中的路径、文件类型、列名和输出文件名等参数。
阅读全文