32. [单选] 【单选题】 下面关于flume的数据源描述正确的是? A A. NetCat Source:可以将命令产生的输出作为源 B B. Spooling Directory Source 这个Source允许你将文件将要收集的数据放置到"自动搜集"目录中。 C C. HTTP Source此Source接受HTTP的GET和POST请求作为Flume的事件。 D D. vro Source监听AVRO端口来接受来自外部AVRO客户端的事件流。
时间: 2024-03-29 22:39:53 浏览: 31
B 下面关于flume的数据源描述正确的是:Spooling Directory Source:这个Source允许你将文件将要收集的数据放置到"自动搜集"目录中。因此,答案是B。Flume是一个分布式的、可靠的、高可用的海量日志采集、聚合和传输的系统。Flume的数据源用于从各种来源获取数据,例如文件、网络、系统日志等。各种数据源包括NetCat Source、Spooling Directory Source、HTTP Source、Avro Source等。NetCat Source用于将命令产生的输出作为源,HTTP Source接受HTTP的GET和POST请求作为Flume的事件,Avro Source监听AVRO端口来接受来自外部AVRO客户端的事件流。Spooling Directory Source允许你将文件将要收集的数据放置到"自动搜集"目录中,Flume会定期扫描该目录,自动将其中的数据收集和传输。
相关问题
单选题) 以下哪个不是Flume的核心组件:( ) A 数据源(Source) B 数据通道(Channel) C 数据槽(Sink) D 数据块(Block)
D 数据块(Block)不是Flume的核心组件。Flume的核心组件包括数据源(Source)、数据通道(Channel)和数据槽(Sink),它们分别负责数据的采集、存储和传输。数据源(Source)指从数据源头采集数据的组件,例如日志文件、网络接口等;数据通道(Channel)是连接数据源和数据槽的组件,用于存储和缓冲数据;数据槽(Sink)是将数据发送到目标存储系统的组件,例如HDFS、HBase等。Flume的数据流架构是由数据源、数据通道和数据槽组成的,数据源将数据发送到数据通道,数据通道将数据发送到数据槽,数据槽将数据发送到目标存储系统。
Flume中的Channel是什么? 口A.用于连接源和Sink的管道 B.用于处理数据的处理器 C.用于存储元数据的仓库 D.用于存储数据的队列
D. 用于存储数据的队列。
在Flume中,Channel是用来暂存数据的。它连接Source和Sink,其主要作用是缓冲存储从Source获取到的数据,等待Sink消费。Channel可以看成是一个队列,存储的是数据的一个副本,以便在数据处理过程中出现错误时可以重试。Flume支持多种类型的Channel,包括内存型、文件型、JDBC型等。