FLume 实现 Spooling Directory Source抓取文件后自动停止

Flume的Spooling Directory Source是用于监控指定目录并将新的文件内容作为事件发送到Flume流程中的组件。要实现抓取文件后自动停止，可以使用Flume的File Channel组件和Flume的Exec Source组件。具体实现步骤如下： 1. 配置Spooling Directory Source，将文件内容发送到File Channel中。 ```properties #定义agent agent.sources = spoolDirSource agent.channels = fileChannel agent.sinks = nullSink #定义source agent.sources.spoolDirSource.type = spooldir agent.sources.spoolDirSource.spoolDir = /data/spool agent.sources.spoolDirSource.fileHeader = true agent.sources.spoolDirSource.basenameHeader = true agent.sources.spoolDirSource.batchSize = 1000 agent.sources.spoolDirSource.pollDelay = 10000 agent.sources.spoolDirSource.channels = fileChannel #定义channel agent.channels.fileChannel.type = file agent.channels.fileChannel.checkpointDir = /data/flume/checkpoint agent.channels.fileChannel.dataDirs = /data/flume/data agent.channels.fileChannel.capacity = 10000000 agent.channels.fileChannel.transactionCapacity = 1000 #定义sink agent.sinks.nullSink.type = null agent.sinks.nullSink.channel = fileChannel ``` 2. 配置Exec Source，使用Exec Source来实现自动停止。 ```properties #定义agent agent.sources = execSource agent.channels = fileChannel agent.sinks = nullSink #定义source agent.sources.execSource.type = exec agent.sources.execSource.command = sh /data/stop_flume.sh agent.sources.execSource.batchSize = 1 agent.sources.execSource.channels = fileChannel #定义channel agent.channels.fileChannel.type = file agent.channels.fileChannel.checkpointDir = /data/flume/checkpoint agent.channels.fileChannel.dataDirs = /data/flume/data agent.channels.fileChannel.capacity = 10000000 agent.channels.fileChannel.transactionCapacity = 1000 #定义sink agent.sinks.nullSink.type = null agent.sinks.nullSink.channel = fileChannel ``` 3. 编写停止脚本stop_flume.sh，当该脚本被执行时，Exec Source会接收到一个事件并停止Flume。 ```shell #!/bin/bash touch /data/stop_flume ``` 4. 在Flume的启动脚本中，添加一个循环来监控停止标志文件的变化情况。当停止标志文件被创建时，停止Flume。 ```shell #!/bin/bash bin/flume-ng agent -n agent -c conf -f conf/flume-conf.properties & PID=$! while [ ! -f /data/stop_flume ] do sleep 1 done kill $PID ``` 这样，当停止标志文件被创建时，Exec Source会接收到一个事件并停止Flume。同时，File Channel中的所有事件都会被处理完毕。

FLume 实现 Spooling Directory Source抓取文件后自动停止

相关推荐

Flume配置文件kafkaSource

flume-ftp-source 相关jar包

flume-sql-source-jar.zip

flume自定义source，采集文件结束后自动关闭

flume tail-dir source实现断点续传采集json文件

Flume自定义Source实现PollableSource后，如何控制采集间隔

flume自定义文件上传的source，要求文件上传后自动开启任务，采集上传文件后自动关闭

flume source

flume如何将文件写入本地文件

flume 采集hdfs上的文件

flume的taildirsource怎么配置

flume监听文件写入hdfs，并且将文件中的,修改为|

如何修改 flume-env.sh 配置文件

flume聚合配置文件

flume具体实现代码

flume配置文件

Flume拦截器可以通过配置文件来删除属性吗

flume将csv文件写入mysql

最新推荐

Flume+Kafka+Storm+Hbase实现日志抓取和实施网站流量统计

kafka+flume 实时采集oracle数据到hive中.docx

47_Flume、Logstash、Filebeat调研报告

Kafka接收Flume数据并存储至HDFS.docx

flume+kafka+storm最完整讲解

BSC绩效考核指标汇总 (2).docx

管理建模和仿真的文件

【进阶】Flask中的会话与用户管理

卷积神经网络实现手势识别程序

BSC资料.pdf