在master 节点上操作,启动 flume 对 /home/ec2-user/flume 文件夹进行监控,对于传入到/home/ec2-user/flume/文件夹下的文件,自动同步到 hdfs 的/fume/路径下面
时间: 2023-08-18 16:05:36 浏览: 146
全面系统完整的Flume教程
您可以在 master 节点上执行以下命令来启动 Flume 监控 /home/ec2-user/flume 文件夹并将文件同步到 HDFS 的 /flume/ 路径下:
1. 确保您已经安装了 Flume 并配置好了 Hadoop 和 HDFS。
2. 创建一个 Flume 配置文件,比如命名为 flume.conf ,并将以下内容复制到文件中:
```
# flume.conf
# 定义 Flume agent
agent.sources = dirSource
agent.channels = memoryChannel
agent.sinks = hdfsSink
# 配置源(Source)
agent.sources.dirSource.type = spooldir
agent.sources.dirSource.spoolDir = /home/ec2-user/flume/
# 配置通道(Channel)
agent.channels.memoryChannel.type = memory
# 配置汇(Sink)
agent.sinks.hdfsSink.type = hdfs
agent.sinks.hdfsSink.hdfs.path = hdfs://<HDFS-NN-IP>:<HDFS-NN-PORT>/flume/
agent.sinks.hdfsSink.hdfs.filePrefix = %{basename}
agent.sinks.hdfsSink.hdfs.fileSuffix = .txt
agent.sinks.hdfsSink.hdfs.fileType = DataStream
# 将源与通道和汇进行绑定
agent.sources.dirSource.channels = memoryChannel
agent.sinks.hdfsSink.channel = memoryChannel
```
注意:请将 `<HDFS-NN-IP>` 和 `<HDFS-NN-PORT>` 替换为您的 HDFS NameNode 的 IP 地址和端口号。
3. 保存并退出配置文件。
4. 使用以下命令启动 Flume:
```
flume-ng agent -n agent -c conf -f flume.conf -Dflume.root.logger=INFO,console
```
现在,Flume 将监控 /home/ec2-user/flume 文件夹,并将传入的文件自动同步到 HDFS 的 /flume/ 路径下。您可以根据需要修改配置文件中的参数来满足您的需求。
阅读全文