写出python代码，用argparse。能在任何文件夹读取Log。具体如下： 1.读取log，当读取到最后一次出现"My name is kitty"时，从下一行开始读 2.删除所有重复的行，只留第一行 3.第一行按照正则规则1分列后，才知道有多少列，写入新的CSV文件Output 4.从下一行开始按照正则规则2分列后，才知道有多少列，继续写入新的CSV文件Output 5.读取CSV文件Output 6.把标题行分为4类，第一类是标题为ABC,DFG的2列，第二类是CAT开头的几列，第三类是DOG开头的几列，第四类是Fish开头的几列 7.把4类标题画成4个曲线图，标注每条线的标题

时间: 2024-03-06 22:47:27 浏览: 73

python 读取更新中的log 或其它文本方式

Python 读取更新中的日志文件（log）或者其它文本文件是常见的需求，尤其是在实时监控系统状态、调试程序或者构建实时日志传输服务时。在本文中，我们将深入探讨一种有效的方法来解决这个问题，主要利用文件对象的 `seek()` 和 `tell()` 方法。我们需要明白，Python 的内置 `open()` 函数可以打开一个文件，并允许我们对其进行读取、写入等操作。在处理日志文件时，由于我们关注的是文件内容的新增部分，所以通常需要在不丢失现有数据的情况下定位到文件的最新位置。这里，我们将文件打开模式设置为 `"rb"`，即二进制读取模式，因为 `seek()` 方法是基于字节偏移量工作的，而文本模式会处理换行符等字符，可能无法准确地按行进行字节计算。以下是一个简单的实现： ```python start_point = 0 def read_logs(): global start_point with open("health_info.log", "rb") as fo: # 使用with语句确保文件在使用后会被正确关闭 print("文件名为: ", fo.name) fo.seek(start_point, 1) # 移动文件读取指针到上一次读取结束的位置，1表示相对当前位置 for line in fo.readlines(): decoded_line = line.decode() print("读取的数据为:", decoded_line) # 输出解码后的文本 # 更新start_point为当前文件指针位置，以便下次读取 start_point = fo.tell() read_logs() ``` 在这个例子中，`read_logs()` 函数首先打开日志文件 `health_info.log`，然后将文件指针移动到 `start_point` 对应的字节位置。`readlines()` 方法会从当前指针位置开始，读取所有剩余的行。解码每行的二进制数据为文本，然后输出。`tell()` 方法返回当前文件指针的位置，并将其赋值给 `start_point`，以便下一次调用 `read_logs()` 时可以从上次停止的地方继续读取。为了实时获取日志的最新内容，你可以设置一个定时器（如使用 `time.sleep()` 或者第三方库如 `schedule`），定期调用 `read_logs()` 函数。这种方法特别适合于Server-Send Event (SSE) 或Websocket等实时通信场景，其中服务器需要持续向客户端推送新的日志条目。需要注意的是，这种方案在大型日志文件中可能会遇到性能问题，因为它每次调用都会读取文件的剩余部分。对于非常活跃的日志文件，可以考虑其他优化策略，比如使用文件监控工具（如 `watchdog` 库）监听文件变化，或者采用数据库存储并使用时间戳记录已读取的日志。 Python 提供了多种方式来读取和跟踪正在更新的文本文件，尤其是日志文件。上述方法通过利用文件指针和全局变量实现了这一目标，但在实际应用中，还需要根据具体场景进行适当的优化和调整。

以下是实现上述功能的 Python 代码，使用了 argparse 进行命令行参数解析： ```python import argparse import re import pandas as pd import matplotlib.pyplot as plt # 定义正则规则1和正则规则2 REGEX1 = r"(\d+\.\d+)\s+" REGEX2 = r"(\d+\.\d+)\s+" def parse_args(): parser = argparse.ArgumentParser(description='处理log文件并生成曲线图') parser.add_argument('input_file', help='输入文件名') parser.add_argument('output_file', help='输出文件名') return parser.parse_args() def read_log(filename): with open(filename, 'r') as f: lines = f.readlines() # 找到最后一次出现"My name is kitty"的位置 idx = len(lines) - 1 while idx >= 0: if "My name is kitty" in lines[idx]: break idx -= 1 # 从下一行开始读取，去除重复行 data = [] for line in set(lines[idx+1:]): data.append(line.strip()) return data def parse_data(data): # 第一行按照正则规则1分列 columns1 = [f'col{i}' for i in range(1, len(data[0].split())+1)] df1 = pd.DataFrame([re.findall(REGEX1, data[0])], columns=columns1) # 从下一行开始按照正则规则2分列 columns2 = [f'col{i}' for i in range(1, len(data[1].split())+1)] df2 = pd.DataFrame([re.findall(REGEX2, line) for line in data[1:]], columns=columns2) # 合并两个数据框 df = pd.concat([df1, df2], axis=1) return df def write_csv(df, filename): df.to_csv(filename, index=False) def read_csv(filename): df = pd.read_csv(filename) return df def plot_data(df): # 分类绘制曲线图 fig, axs = plt.subplots(2, 2) axs[0, 0].plot(df['ABC'], label='ABC') axs[0, 0].plot(df['DFG'], label='DFG') axs[0, 0].set_title('Title for ABC and DFG') axs[0, 0].legend() axs[0, 1].plot(df.filter(regex='^CAT'), label='CAT') axs[0, 1].set_title('Title for CAT') axs[0, 1].legend() axs[1, 0].plot(df.filter(regex='^DOG'), label='DOG') axs[1, 0].set_title('Title for DOG') axs[1, 0].legend() axs[1, 1].plot(df.filter(regex='^Fish'), label='Fish') axs[1, 1].set_title('Title for Fish') axs[1, 1].legend() plt.show() def main(): args = parse_args() # 读取log文件 data = read_log(args.input_file) # 解析数据，写入CSV文件 df = parse_data(data) write_csv(df, args.output_file) # 读取CSV文件，画图 df = read_csv(args.output_file) # 把标题行分为4类 df.columns = df.columns.str.strip() # 去除列名前后的空格 df_abc = df[['col1', 'col2']] # ABC和DFG df_cat = df.filter(regex='^CAT') # CAT开头的列 df_dog = df.filter(regex='^DOG') # DOG开头的列 df_fish = df.filter(regex='^Fish') # Fish开头的列 # 画图 plot_data(df_abc) plot_data(df_cat) plot_data(df_dog) plot_data(df_fish) if __name__ == '__main__': main() ``` 假设输入文件名为 `input.log`，输出文件名为 `output.csv`，可以使用以下命令运行程序： ``` python program.py input.log output.csv ``` 其中 `program.py` 为程序名。

阅读全文

相关推荐

python实现读取文件夹下所有excel文件内容上传MySQL数据库，并附带生成log文件，同时上传成功之后清空文件夹

python读取多层嵌套文件夹中的文件实例

java+sql server项目之科帮网计算机配件报价系统源代码.zip

【java毕业设计】智慧社区老人健康监测门户.zip

【java毕业设计】智慧社区心理咨询平台（源代码+论文+PPT模板）.zip

计算机系统基础实验LinkLab实验及解答：深入理解ELF文件与链接过程

基于关键词的历时百度搜索指数自动采集资料齐全+详细文档+高分项目+源码.zip

用C语言写出一个简单的圣诞树，让你的朋友们体验一下程序员的浪漫，点开即令哦！

免费下载：Hilma af Klint a Biography (Julia Voss)_tFy2T.zip

屏幕截图 2024-12-21 172527.png

2024级涉外护理7班马天爱劳动实践总结1.docx

IndexOutOfBoundsException(解决方案).md

【java毕业设计】智慧社区垃圾分类门户.zip

【java毕业设计】智慧社区网端门户（源代码+论文+PPT模板）.zip

最新推荐

python读取多层嵌套文件夹中的文件实例

使用python批量读取word文档并整理关键信息到excel表格的实例

Python读取指定日期邮件的实例

Python脚本实时处理log文件的方法

java+sql server项目之科帮网计算机配件报价系统源代码.zip

Java毕业设计项目：校园二手交易网站开发指南

管理建模和仿真的文件

【MVC标准化：肌电信号处理的终极指南】：提升数据质量的10大关键步骤与工具

能否提供一个在R语言中执行Framingham数据集判别分析的详细和完整的代码示例？

Blaseball Plus插件开发与构建教程