python访问路径下所有excel文件,统计sheet_name=“功能点拆分表”excel列名为“子过程描述颜色”的列,对里面的内容进行分类计数,包含文件名列写入新的excel中
时间: 2024-03-28 12:42:33 浏览: 232
好的,我明白了。为了完成这个任务,我们需要使用Python的pandas库来读取Excel文件和处理数据,以及os库来访问文件路径。以下是代码实现:
```python
import os
import pandas as pd
# 设置要访问的文件夹路径
folder_path = 'your/folder/path'
# 创建一个空的DataFrame来存储所有的数据
data = pd.DataFrame(columns=['文件名', '分类', '计数'])
# 遍历文件夹中的所有Excel文件
for filename in os.listdir(folder_path):
if filename.endswith('.xlsx') or filename.endswith('.xls'):
file_path = os.path.join(folder_path, filename)
# 读取Excel文件中的数据
df = pd.read_excel(file_path, sheet_name='功能点拆分表', usecols=['子过程描述颜色'])
# 对子过程描述颜色列进行分类计数
counts = df['子过程描述颜色'].value_counts()
# 将计数结果添加到DataFrame中
for color, count in counts.items():
data = data.append({'文件名': filename, '分类': color, '计数': count}, ignore_index=True)
# 将结果写入新的Excel文件中
data.to_excel('result.xlsx', index=False)
```
这段代码会访问指定的文件夹路径,读取所有Excel文件中名为“功能点拆分表”的工作表中列名为“子过程描述颜色”的列,对其中的内容进行分类计数,并将结果存储在一个DataFrame中。最后,将结果写入名为“result.xlsx”的新Excel文件中。
需要注意的是,在上述代码中,你需要将“your/folder/path”替换为实际的文件夹路径。另外,如果你的Excel文件中包含多个工作表,你需要根据实际情况修改代码中的sheet_name参数。
阅读全文