写一个随机抽取x本txt的脚本,每天随机抽取20本txt,看下txt里是否有什么badcase(包含版本信息,广告,公式错乱,乱码等),输出xlsx: 第一列: txt完整路径,第二列:txt文件名, 第三列:什么问题,第四列:第几行发现的 windows环境 库都安装好了
时间: 2024-02-24 13:54:59 浏览: 75
好的,以下是一个Python脚本的示例,可以实现你的要求。在运行之前,需要安装Python的pandas和openpyxl库。
```python
import os
import random
import pandas as pd
from openpyxl import Workbook
# 设置抽取的txt文件夹路径和输出文件路径
txt_dir = r'C:\txt_dir'
output_file = r'C:\output.xlsx'
# 设置抽取20个txt文件
num_files = 20
# 定义badcase的关键词
keywords = ['版本信息', '广告', '公式错乱', '乱码']
# 获取txt文件列表
txt_files = [os.path.join(txt_dir, f) for f in os.listdir(txt_dir) if f.endswith('.txt')]
# 随机抽取num_files个txt文件
selected_files = random.sample(txt_files, num_files)
# 遍历每个txt文件,检查是否存在badcase
results = []
for f in selected_files:
with open(f, 'r', encoding='utf-8') as file:
lines = file.readlines()
for i, line in enumerate(lines):
for keyword in keywords:
if keyword in line:
results.append([f, os.path.basename(f), keyword, i+1])
break
# 将结果输出到xlsx文件
df = pd.DataFrame(results, columns=['txt完整路径', 'txt文件名', '问题', '第几行发现的'])
writer = pd.ExcelWriter(output_file, engine='openpyxl')
df.to_excel(writer, index=False)
writer.save()
```
在脚本中,你需要修改以下内容:
- 将`txt_dir`变量设置为包含txt文件的文件夹的路径。
- 将`output_file`变量设置为输出结果的xlsx文件的路径。
- 根据需要设置抽取的txt文件数量和badcase的关键词列表。
运行脚本后,将在指定的输出文件路径中生成一个xlsx文件,其中包含抽取的txt文件的完整路径、文件名、badcase问题和出现问题的行号。
阅读全文