32. [单选] 【单选题】下面关于flume的数据源描述正确的是？ A A. NetCat Source：可以将命令产生的输出作为源 B B. Spooling Directory Source 这个Source允许你将文件将要收集的数据放置到"自动搜集"目录中。 C C. HTTP Source此Source接受HTTP的GET和POST请求作为Flume的事件。 D D. vro Source监听AVRO端口来接受来自外部AVRO客户端的事件流。

B 下面关于flume的数据源描述正确的是：Spooling Directory Source：这个Source允许你将文件将要收集的数据放置到"自动搜集"目录中。因此，答案是B。Flume是一个分布式的、可靠的、高可用的海量日志采集、聚合和传输的系统。Flume的数据源用于从各种来源获取数据，例如文件、网络、系统日志等。各种数据源包括NetCat Source、Spooling Directory Source、HTTP Source、Avro Source等。NetCat Source用于将命令产生的输出作为源，HTTP Source接受HTTP的GET和POST请求作为Flume的事件，Avro Source监听AVRO端口来接受来自外部AVRO客户端的事件流。Spooling Directory Source允许你将文件将要收集的数据放置到"自动搜集"目录中，Flume会定期扫描该目录，自动将其中的数据收集和传输。

#定义三大组件的名称 a.sources = r a.sinks = k1 k2 k3 a.channels = c1 c2 c3 #将数据流复制给所有channel a.sources.r.selector.type = replicating # 配置Source组件 a.sources.r.type = exec #exec表示数据源来自运行给定的Unix命令后生成的数据 a.sources.r.command = cat /home/bit/ys/hngyzd.csv # kafka a.sinks.k1.type = org.apache.flume.sink.kafka.KafkaSink a.sinks.k1.kafka.topic = data a.sinks.k1.kafka.bootstrap.servers = localhost:9092 a.sinks.k1.kafka.flumeBatchSize = 20 a.sinks.k1.kafka.producer.acks = 1 a.sinks.k1.kafka.producer.linger.ms = 1 a.sinks.k1.kafka.producer.compression.type = snappy a.channels.c1.type = memory a.channels.c1.capacity = 100000 a.channels.c1.transactionCapacity = 100 # mysql a.sinks.k2.type =com.us.flume.MysqlSink a.sinks.k2.hostname=localhost a.sinks.k2.port=3306 a.sinks.k2.databaseName=ys a.sinks.k2.tableName=table1 a.sinks.k2.user=bit a.sinks.k2.password=123456 a.channels.c2.type = memory a.channels.c2.capacity = 100000 a.channels.c2.transactionCapactiy = 2000 # hdfs a.sinks.k3.type = hdfs a.sinks.k3.hdfs.path = hdfs://localhost:9000/user/bit/ys #积攒多少个Event才flush到HDFS一次 a.sinks.k3.hdfs.batchSize = 100 #设置文件类型，可支持压缩 a.sinks.k3.hdfs.fileType = DataStream #多久生成一个新的文件 a.sinks.k3.hdfs.rollInterval = 5 a.channels.c3.type = memory a.channels.c3.capacity =100000 a.channels.c3.transactionCapacity = 100 # Bind the source and sink to the channel a.sources.r.channels = c1 c2 c3 a.sinks.k1.channel = c1 a.sinks.k2.channel = c2 a.sinks.k3.channel = c3

这段代码是一个 Apache Flume 的配置文件，用于将数据从一个源头复制到多个目的地。其中，a.sources 定义了数据源，a.sinks 定义了数据的目的地，a.channels 定义了数据在传输过程中的缓存区。具体配置如下： - 数据源：a.sources.r.type = exec 表示数据源来自运行给定的 Unix 命令后生成的数据，a.sources.r.command = cat /home/bit/ys/hngyzd.csv 表示运行 cat 命令读取指定文件中的数据作为数据源。 - Kafka 目的地：a.sinks.k1.type = org.apache.flume.sink.kafka.KafkaSink 表示将数据发送到 Kafka，a.sinks.k1.kafka.bootstrap.servers = localhost:9092 表示连接到本地的 Kafka 服务器，a.sinks.k1.channel = c1 表示从名为 c1 的缓存区取出数据发送到 Kafka。 - MySQL 目的地：a.sinks.k2.type = com.us.flume.MysqlSink 表示将数据写入 MySQL 数据库，a.sinks.k2.hostname = localhost、a.sinks.k2.port = 3306、a.sinks.k2.databaseName = ys、a.sinks.k2.tableName = table1、a.sinks.k2.user = bit、a.sinks.k2.password = 123456 分别表示连接到本地的 MySQL 数据库 ys 中的 table1 表，并使用 bit 用户名和 123456 密码进行认证。a.sinks.k2.channel = c2 表示从名为 c2 的缓存区取出数据写入 MySQL。 - HDFS 目的地：a.sinks.k3.type = hdfs 表示将数据写入 HDFS，a.sinks.k3.hdfs.path = hdfs://localhost:9000/user/bit/ys 表示将数据写入到本地的 HDFS 文件系统中的 /user/bit/ys 目录下。a.sinks.k3.hdfs.batchSize = 100 表示积攒多少个事件才将它们一起 flush 到 HDFS 中，a.sinks.k3.hdfs.rollInterval = 5 表示每隔 5 秒生成一个新的文件。a.sinks.k3.channel = c3 表示从名为 c3 的缓存区取出数据写入 HDFS。最后，a.sources.r.channels、a.sinks.k1.channel、a.sinks.k2.channel 和 a.sinks.k3.channel 分别将数据源和目的地绑定到缓存区 c1、c2 和 c3。这样，数据在传输过程中会先进入缓存区，再从缓存区分别发送到 Kafka、MySQL 和 HDFS 中。

单选题) 以下哪个不是Flume的核心组件:( ) A 数据源(Source) B 数据通道(Channel) C 数据槽(Sink) D 数据块(Block)

D 数据块(Block)不是Flume的核心组件。Flume的核心组件包括数据源(Source)、数据通道(Channel)和数据槽(Sink)，它们分别负责数据的采集、存储和传输。数据源(Source)指从数据源头采集数据的组件，例如日志文件、网络接口等；数据通道(Channel)是连接数据源和数据槽的组件，用于存储和缓冲数据；数据槽(Sink)是将数据发送到目标存储系统的组件，例如HDFS、HBase等。Flume的数据流架构是由数据源、数据通道和数据槽组成的，数据源将数据发送到数据通道，数据通道将数据发送到数据槽，数据槽将数据发送到目标存储系统。

阅读全文

单选题) 以下哪个不是Flume的核心组件:( ) A 数据源(Source) B 数据通道(Channel) C 数据槽(Sink) D 数据块(Block)

相关推荐

flume-http-source

flume-ng-sql-source:Flume Source从SQL数据库导入数据

Flume的UDP源 com.whitepages.flume.plugins.source.udp.UDPSource

flume-sqs-source:Flume Amazon SQS 源插件

flume-tailer-source:Apache Flume 源到尾文件

tail-file-source:用于拖尾文件的 Flume NG 源

2.0.0.rar之spark-streaming-flume-sink_2.11-2.0.0.jar

ssh-spool-source:Flume的原型SshSpoolSource-考虑通过SSH假脱机目录源

Flume中的Channel是什么? 口A.用于连接源和Sink的管道 B.用于处理数据的处理器 C.用于存储元数据的仓库 D.用于存储数据的队列

flume可以source的数据源

[ys@hadoop102 flume]$ flume-ng agent --conf-file /path/to/file-flume-kafka.conf --name kafka-flume-agent -Dflume.root.logger=INFO,console bash: flume-ng: 未找到命令...

flume接收netcat

flume netcat 监听不到数据

bash: flume-ng: 未找到命令...

对flume架构描述正确的是

flume source

将 flume 文件先拷贝到桌面上，在移动到/usr/local 下，在/usr/local 解压 tar -zxvf apache-flume-1.7.0-bin.tar.gz mv apache-flume-1.7.0-bin flume #改名

移动flume-dir-hdfs.conf文件到/opt/flume-7.0/conf/job下

大家在看

js 在线编辑office source 浏览器在线打开office

flac3d中文用户手册

如何降低开关电源纹波噪声

UVM基础学习.ppt

plc 课程设计

最新推荐

kafka+flume 实时采集oracle数据到hive中.docx

Kafka接收Flume数据并存储至HDFS.docx

HTML挑战：30天技术学习之旅

【CodeBlocks精通指南】：一步到位安装wxWidgets库（新手必备）

andorid studio 配置ERROR: Cause: unable to find valid certification path to requested target

VC++实现文件顺序读写操作的技巧与实践

【大数据时代必备：Hadoop框架深度解析】：掌握核心组件，开启数据科学之旅

opencv的demo程序

NeuronTransportIGA: 使用IGA进行神经元材料传输模拟

【Linux多系统管理大揭秘】：专家级技巧助你轻松驾驭