理解Logstash配置与核心架构：输入、过滤与输出

需积分: 19 30 浏览量更新于2024-09-14 收藏 200KB PDF 举报

深谈Logstash Logstash是一款强大的日志管理和数据管道工具，它主要用于收集、处理和发送机器产生的各种日志数据，常用于与Elasticsearch、Logstash和Kibana（ELK）堆栈集成。然而，由于其非编程语言的本质，用户在配置时需要注意以下关键点： 1. **理解工作原理**: - Logstash不是编程语言，它更像是一个配置驱动的数据处理引擎，一旦启动后，配置文件中的规则就会被编译并固化。 - Logstash的运行流程由固定的架构定义，包括输入(input)、过滤器(filter)和输出(output)三个部分。 2. **配置结构**: - 配置文件主要由input、filter和output三个section组成，每个section下可以配置特定类型的插件，如内置的5种类型：input、filter、output、codec和mixin。 - codec是作为input和output配置中的可选组件，用于指定数据的编码或转换方式，例如rubydebug插件允许自定义输出字符集。 - mixin主要是用于插件开发的高级特性，普通用户通常无需关注。 3. **插件和基础配置**: - 输入和输出阶段可以使用logstash本身的API，如在input阶段进行条件判断或output阶段操作字段，但这些功能受限于基类提供的接口，具体查阅文档即可。 - logstash的核心逻辑体现在pipeline.rb中，通过input thread、filter thread pool和output thread之间的协作处理数据。数据以事件(event)的形式在20条大小的内部队列间传递，设计目的是避免处理过载。 4. **事件和配置变量**: - Logstash处理的是LogStash::Event对象，配置中的条件判断和数据引用都基于event对象的属性，如timestamp等字段。因此，理解和使用这些配置方法的前提是事件已经存在。 5. **性能考虑**: - 内部队列的容量设计为40条，这意味着如果数据量超过这个阈值，Logstash可能会拒绝新的输入，以保护系统稳定。总结来说，Logstash的配置虽然看似灵活，但实际上受限于其工作原理和架构。深入理解这些概念对于有效利用Logstash处理和分析日志至关重要，包括正确配置插件、合理利用内置函数以及理解数据流的处理机制。同时，熟悉基础配置选项和事件模型有助于编写高效且易维护的配置文件。

logstash 的配置文件，首先要记住几点：第一，他不是编程语言，所以不要想当然觉得他应

该能如何；第二，他是启动的时候编译好就固定了。

配置分为三个 section。input、filter、output。logstash 本身有 5 种 plugin，除了 input、filter、

output，还有 codec 和 mixin。

codec 是作为 input 和 output 配置里的选项使用的，比如我们最常用的

output {

stdout {

codec => rubydebug

}

很多人以为是 codec => "rubydebug"，不对，其实这个是 codec => rubydebug {}

rubydebug 其实能再带自己的参数的：

output {

stdout {

codec => rubydebug {

charset => "utf-8"

}

这里能省略，只能是说作者帮忙，不要多想……

mixin，是做插件二次开发的时候用的，跟配置没关系。目前也只有 httpclient 和 awsconfig

两个，一般用户不用关心这个。

好，下一步，logstash 中有些比较通用的配置项，其实就是各插件的基类实现了的方法。所

以很多人问：能不能在 input 阶段用 if 啊，能不能在 output 阶段 remove_field 啊，等等问题，

这个其实看文档，看基类实现，都很明了的。

更广泛一点的讲，logstash 的核心是 pipeline.rb。其中的逻辑是起一个 input thread，一个 filter

threadpool，一个 output thread。三者之间各经过一个固定大小为 20 的内部队列传递。output

thread 里，对 worker，则再有一层内部队列分到每个 worker thread 上。

所以，logstash 内部，就这么两层可以缓存数据的地方，20+20=40 条日志。设计思路是：处

理不过来，就不要 input 了。

队列中流转的，叫 event。类是 LogStash::Event，具体的变量一般都写成 event，这就是为什

么看 logstash-filter-ruby 里示例都是 event['@timestmap']的原因。

我们在配置里，if 条件判断的也好，采用%{}，[][]等 sprintf 方法引用的也好，都是这个 event

的属性，所以，要能用这些配置方法，首先，你要保证已经有 event 了。

这里又有一个作者帮忙的缩写，再次提醒不要想多了的地方：

下载后可阅读完整内容，剩余5页未读，立即下载

cc455

粉丝: 1
资源: 5

理解Logstash配置与核心架构：输入、过滤与输出

logstash安装包

logstash启动脚本

logstash使用总结

logstash

logstash:Logstash研究

logstash 5.4.0

安装logstash

logstash数据库

logstash安装

logstash端口

最新资源