首页我有一个包含日志的日志文件，一些行包含我感兴趣的信息。它将如下所示：host\”:\”example.com\”。它可能是 example.com，也可能是其他主机名。请编写一个我可以在 bash 中执行的单行代码（可能使用 grep 或 perl）来查找此类文本（使用模式匹配），删除重复项并打印出找到的主机名。

我有一个包含日志的日志文件，一些行包含我感兴趣的信息。它将如下所示：host\”:\”example.com\”。它可能是 example.com，也可能是其他主机名。请编写一个我可以在 bash 中执行的单行代码（可能使用 grep 或 perl）来查找此类文本（使用模式匹配），删除重复项并打印出找到的主机名。

时间: 2023-02-07 17:51:06 浏览: 127

timegrep:通过日志文件执行二进制搜索以查找时间范围并打印相应的行

时间grep.py 作者：丹尼斯威廉姆森 20100113 回应 Fabrice FACORAT 20110914 的改进通过日志文件执行二进制搜索以查找时间范围并打印相应的行支持的日志格式： W3C 扩展：%Y-%m-%d %H:%M:%S 系统日志：%b %d %H:%M:%S NSCA Common/Apache: 主机 rfc931 用户名 [%d/%b/%Y:%H:%M:%S +TZ] 绑定 8：%d-%b-%Y %H:%M:%S。 Nginx 错误日志：%Y/%m/%d %H:%M:%S。用 Python 2.6 测试您可以使用以下方法安装它： pip install timegrep 待办事项：如果搜索落在第一行或最后一行的中间，请确保它有效 TODO：确保同步读取恰好落在正在搜索的行的开头，然后被第二次读取跳过的行 DONE：支持更多日志时间格式 T

你可以使用 grep 和 sort 命令来实现这个目标。具体地，你可以使用以下命令来查找所有匹配文本，删除重复项并打印出找到的主机名： ```bash grep -Eo 'host\".*?:\".*?\"' logfile.txt | sort | uniq | cut -d ':' -f2 | tr -d '"' ``` 这行命令的工作流程是： 1. 使用 grep 命令查找所有匹配文本，使用 -E 选项表示使用扩展正则表达式，使用 -o 选项表示只输出匹配的文本，而不是整行。 2. 使用 sort 命令对输出进行排序。 3. 使用 uniq 命令删除重复项。 4. 使用 cut 命令将输出分割成多列，使用 -d 选项指定分隔符为冒号，使用 -f2 选项表示只输出第二列。 5. 使用 tr 命令将双引号删除。这行命令会在输出中打印出所有找到的主机名。

阅读全文