没有合适的资源?快使用搜索试试~ 我知道了~
首页华为大数据认证HCIP-Big Data Developer H13-723大数据题库
华为大数据认证HCIP-Big Data Developer H13-723大数据题库

华为大数据认证HCIP-Big Data Developer H13-723大数据题库 华为大数据认证HCIP-Big Data Developer H13-723大数据题库
资源详情
资源评论
资源推荐

更多 IT 认证课程请访问 美河学习在线 www.eimhe.com
1.在 HBase 写数据的业务逻辑实现过程中,如下哪个接口或类是不需要涉及的?
A.Put B.HTable C.HBaseAdmin D.PutList
Answer: C
2.在 MapReduce 的应用程序开发中,下列哪个 JAVA 类负责管理和运行一个计算任务?
A.lob B.Context C.FileSystem D.Configuration
Answer: A
3. Fusionlnsight HD 中,Oozie 在提交作业前需要先上传本作业所依赖的配置文件和 jar 包到 HDFS
A.正确 B.错误
Answer: A
4.以下哪些方法可以生成 DStream 对象?
A.KafkaUtils.createStream(…) B.KafkaUtils.createDirectStream(…)
C.StreamingContext.socketStream D.StreamingContext.fileStream(…)
Answer: ABCD
5.Fusionlnsight HD 系统中,关于 Hive 提供的文件格式,哪个不是列式文件?
A.CRC B.Parquet C.RCFile D.TextFile
Answer: D
6. Fusionlnsight HD 中,对 Solr 各类资源的创建和读写权限使用,以下说法错误的是?
A. Solr 用户组用户可以创建配置集,并在创建 Collection 时指定该配置集
B. Solr 用户组的用户可以创建 Collection
C. Collection 创建者、对该 Collection 具有读写权限的角色以及 Solr admin 角色可以对 Collection 进行更新
D. 只有 Collection 创建者和 Solr admin 角色可以删除 Collection2
Answer: A
7.在 Spark 中,以下哪项是对 DataFrame 取交集的算子?
A. filter (condifionExpr: String): DataFrame
B. join (right: DataFrame, join Exprs: Column): DataFrame
C. intersect (other: Data Fra me): Data Fra me
D. dropDuplicates (): DataFrame
Answer: C
8.通过 HBase 的 createTable 方法创建一张表,必须传入的参数有?
A.表名 B.表名和列 C.表名和列族 D.可以为空
Answer: C
9.HDFS 客户端所在节点的系统时间与 Fusionlnsight HD 集群的系统时间要保持一致,若有时间差,那么时间差应小
于几分钟?
A.5 B.10 C.20 D.30
Answer: A
10.在 Flume 级联传输过程中,可以使用 fail over 模式传输,这样如果下一跳的 Flume 节点故障或者数据接受异
常时,可以自动切换到另外一路上继续传输。
A.正确 B.错误
Answer: A
11.Fusionlnsight HD 中,属于 Streaming 服务的角色有哪些?(多选)
A.Nimbus B.Supervisor C.Broker D.quorumpeer
Answer: AB
12.关于 Streaming 的拓扑(Topology),下面描述错误的是?
A. 一个 Topology 是由一组 Spout 组件和 Bolt 组件通过 Stream Groupings 进行连接的有向无环图 3(DAG)
B. Topology 会一直运行,直到它被显式 kill
C.业务逻辑都被封装 Topology 中 D.一个 Topology 只可以指定启动一个 Worker 进程

更多 IT 认证课程请访问 美河学习在线 www.eimhe.com
Answer: D
13.HDFS 客户端以 N 副本向 HDFS 写文件时,若其中一个副本写入失败,则所有副本都会返回写入失败。
A.正确 B.错误
Answer: B
14.Fusionlnsight HD 中,使用 Streaming 的命令 ? 方式提交 example.jar 中的 om huawei example WrodCount 任
务,任务名称为 wcTeat,以下执行命令正确的是?
A. storm jar example jar wcTest om huawei example WordCount B. storm jar example jar wcTest WrodCount
C. storm jar example jar om huawei example WordCount wcTest D. storm jar example jar WorkCount wcTest
Answer: C
15.对于运行在 MapReduce 平台上的应用程序,此应用程序所依赖的 jar 包会被放到哪里?
A.HIVE B.HBASE C.HDFS D.DB
Answer: C
16.RDD 作为 Spark 最核心的对象,具有以下哪些特点?(多选)
A.只读 B.分区 C.容错 D.高效
Answer: ABCD
17. Fusionlnsight HD 中,在实时处理场景中,可使用的计算框架有哪些?(多选)
A. Spark Streaming B.Streaming C.MapReduce D.HDFS
Answer: AB
18.Fusionlnsiht HD 中,Oozie 客户端的 JAVA API 在运行任务时会调用 OozieClient 类的哪个方法?
A.suspend B.getJoblnfo C.submit D.run
Answer: D
19.将数据块存储大小设置为 128M,HDFS 客户端在写文件时,当写入一个 100M 大小的文件,实际占用储存空间
为多大?
A.128M B.100M C.64M D.50M
Answer: B
20.下列哪些原因会导致 HDFS 的 NameNode 进入 safemode(安全只读模式)?(多选)
A.主备 NameNode 的元数据所在磁盘空间不足。 B.丢失块数超过阈值。
C.丢失副本超过阈值。 D.损坏副本超过阈值。
Answer: AB
21.对于 Fusionlnsight HD 平台的 HBase 组件,增加二级索引需要定义二级索引的哪些属性?(多选)
A.索引名 B.索引列 C.索引列类型 D.索引列所归属的列族名称
Answer: ABCD
22.当一个 MapReduce 应用程序被执行时,如下哪一个动作是 map 阶段之前发生的?
A.split B.combine C.partition D.sort
Answer: A
23.Fusionlnsight HD 中,关于 Hive UFD 二次开发,如下描述正确的是?(多选)
A.用户自定义的 UDF 在被使用之前,需要先在 Hive 系统中创建此 UD 只
B.用户自定义的 UDF,不允许加入汇总和状态等信息。
C.用户自定义的 UDF,可以根据实际情况添加 deterministic 和 statefull 等注解。
D.安全集群下,用户自定义的 UDF,建议在每次使用前都创建一次。
Answer: AC
24.在 Fusionlnsight HD 产品中,Kafka 服务的角色名称是?
A.Producer B.Broker C.Consumer D.ZooKeeper
Answer: B
25.Spark 应用程序有哪几种参数设置方法?(多选)
A.在应用的配置文件 spark-defaults.conf 中进行配置 B.在提交应用时,通过—conf 进行设置

更多 IT 认证课程请访问 美河学习在线 www.eimhe.com
C.在应用的代码里面,通过 SparkContext 的 setProperty 方法进行设置
D.在应用的代码里面,通过 SparkConf 对象进行设置
Answer: ABD
26.在 Fusionlnsight HD 集群中,Flume 不支持将采集数据写入到集群中那个服务?
A.HDFS B.HBase C.Kafks D.Redis
Answer: D
27.在 Spark 中,假设 lines 是一个 DStream 对象,以下哪个语句可以周期统计这个流上的单词数?
A. lines.flatMap(_.split? ?)).map(word=>(word,1)).reduce(_+_).print ( )
B. lines.flatMap(_.split? ?)).map(word=>(word,word.length())).reduceByKey(_+_).print ( )
C. lines.flatMap(_.split? ?)).map(word=>(word,1)).reduceByKey(_+_).print ( )
D. lines.flatMap(_.split? ?)).flatmap(word=>(word,1)).groupByKey(_+_).print ( )
Answer: C
28.HBase 过滤器能将列名或列值设置为过滤条件,同时支持多个过滤器配合使用。
A.正确 B.错误
Answer: A
29.关于 Streaming 的容灾能力,下列说法正确的是?(多选)
A. Supervisor 进程退出后能够被 Nimbus 自动识别并拉起,不影响正在运行的业务。
B. Worker 异常退出后能够被 Supervisor 自动拉起,无需人工干预。
C.节点故障时,该节点上的任务会被重分配到其他正常的节点,无需人工干预。
D.Nimbus 故障后,备 Nimbus 会自动接管,不影响正在运行的业务。
Answer: ABCD
30.HBase 表的 rowkey 设计是一个很重要的开发设计环节。
A.姓名+手机号 B.日期+手机号 C.手机号+日期 D.手机号+姓名
Answer: C
31.Fusionlnsigt HD 中,下列哪些组件可用于数据采集?(多选)
A.Flume B.Loader C.HBase D.MapReduce
Answer: AB
32.在使用 Solr 进行全文检索时,可以通过 wt 参数制定查询结果的响应格式。关于 Solr 查询结果的响应格式,
下面说法错误的是?
A.支持 CSV 和 JSON B.支持 CSV、JSON 和 HTML C.支持 CSV、JSON 和 XML
Answer: B
33.在 Fusionlnsight HD 产品的 Solr 应用开发时,可以通过 Solr Admin UI 对 Collection 进行一些验证。下面关于
Solr Admin UI 说法正确的有?(多选)
A.点击 Cloud 下的 Tree,查看 Solr Cloud 中 Collections、配置集和 live_nodes 等元数据信息
B.点击 Cloud,查看各 Collection 下各个 ShardReplica 的分布及状态
C.进入某 Collection 的 Shard Replica 的 Core Overview 界面,可以查看到该 Replica 索引实际文档条数、存储大小
和位置信息
D. Solr 用户组、Solr admin 角色和 Super group 的用户可以访问 Solr Admin UI
Answer: ABCD
34.某项目需要对某个地区的上网??进行保存,并全文检索这些上网记录里是否有??信息,用于预防本地区的犯
罪。请问这种场景下,如下哪种方案最优方案?
A.在 Solr 上建立索引,并保存数据,在全文检索时,将所有数据全部返回。
B.在 HBase 上存放数据,通过 HBase 的过滤特性,满足模糊匹配查询。
C.存放数据时,在 Solr 上建立索引,在 HBase 存放完整数据??时,通过 Solr 全文检索获取和记录关键信息,
通过关键信息在 HBase 上获取完整记录。
Answer: C

更多 IT 认证课程请访问 美河学习在线 www.eimhe.com
35.Fusionlnsight HD 的 Hive 中,用户自定义的 UDF 可以和 Hive 内置的 UDF 重名,这种情况下,将使用用户自
定义的 UDF。
A.正确 B.错误
Answer: B
36.假设有一个应用,有 10 个表,每个表记录数为千万级别,字段数约 20 个。现使用 Redis 来缓存这 10 个表
的数据,对其数据结构的设计,以下哪一项是最佳设计?
A.采用 hash 结构,且一个表使用一个 hash KEY,表中一行记录对于 hash KEY 的一个 field。
B.采用 hash 结构,每个表的每一行记录使用一个 hash KEY,hash KEY 的 field 对应表记录的字段,且设计 KEY 时
各个表添加不同的前缀以区分。
C.采用 string 结构,每个表的每一行记录的每个字段使用一个 KEY。
D.采用 string 结构,每个表的每一行记录使用一个 KEY,value 为表中一行记录的所有字段??后的值。
Answer: B
37.Fusionlnsight HD 的 Hive 应用中,存在如下场景:???存放文件有较高的??效率,且大部分??只涉及文
件的一部分字母,这种场景适合采用列式文件(ORC F??)存储。
A.正确 B.错误
Answer: A
38.在 Fusionlnsight HD 中,Flume 支持以下哪些 source 类型?(多选)
A.Avro B.HBase C.Kafka D.HTTP
Answer: ACD
39.Fusionlnsight HD 中,下列哪几项属于 Oozie 的 MapReduce Action 的配置项?(多选)
A.name-node B.source C.mapred.mapper.class D.job-tracker
Answer: ACD
40.在 Kafka 中,Producer 可以通过配置同步参数(producer.type),保证数据按顺序发送。
A.正确 B.错误
Answer: A
41.在 Fusionlnsight HD 的客户端,执行 kinit{账号}命令是为了得到 KDC 的哪一项内容?
A.Krb5.conf B.TGT C.ST D.jaas.conf
Answer: B
42.Hive 支持下列哪些表类型?(多选)
A.分区表 B.分桶表 C.倾斜表 D.分区+分桶表
Answer: ABCD
43.在 Spark 中,累加器可以实现高速并行的计数器和变量求和;在 Spark 的应用程序开发过程中,只有在 Driver 上
获取此计数器的值。
A.正确 B.错误
A
44.Redis 的 LIST 数据结构,适用于下列哪些场景?(多选)
A.构建队列系统,例如消息队列 B.uniq 操作,例如获取某段时间所有数据的排重值
C.取最新 N 个数据操作:例如对某条微博,获取最新的 10 个评论 D.模拟栈操作
Answer: ACD
45.Fusionlnsight HD 中,在使用 Streaming 的 ACK 机制时,下列哪些说法是正确的?(多选)
A.启用了 Acker 之后,Streaming 会识别发送失败的 Tuple 并自动重发,无需人为干预。
B.Acker 会标识处理超时或者处理失败的消息为 fail。
C.从 spout 开始,形成的 Tuple 树中任何一个环节失败都会标记整棵树失败。
D.应用需要在 spout 的 fail()接口方法中实现消息重发逻辑。
Answer: BCD
46.某大型生产企业,计划将内部的物流数据和销售数据进行大数据转型,设计部给出了数据存储方案的分析,以下

更多 IT 认证课程请访问 美河学习在线 www.eimhe.com
哪些描述是正确的?
A. HBase 存储海量数据,并支持动态扩展,能完成物流和销售数据的存储需求。
B. Hbase 支持高校随即读取,经过合理设计能完成对物流情况的实时分析与指挥。
C.物流数据非常稀疏,HBase 能高效地处理稀疏数据。
D.HBase 可以搭建在普通商用服务器上,构建成本相对较低。
Answer: ABCD
47.HDFS 集群跟目录下存在一个文件 text.txt,下列哪个命令可以查到此文件所存储的 DatNode 节点信息?
A. hdfs fsck /test.txt –files B. hdfs fsck /text.txt –locations
C. hdfs fsck /test.txt –blocks D. hdfs fsck /test.txt –list –corruptfileblocks
Answer: B
48.HDFS 客户端以 N 副本写文件时,下列关于写过程正确的是?(多选)
A.每个 DataNode 最多存储 1 个副本。 B.支持多用户同时对同一文件的写操作。
C.数据块的第一个副本优先放在写入数据块的客户端所在的节点。
D.复制的文件块默认都存在同一机架上。
Answer: AC
49.Fusionlnsight HD 系统中,Hive 支持的接口类型有哪些?(多选)
A. JDBC 接口 B. ODBC 接口 C. Python 接口 D. Ruby 接口
Answer: ABC
50.在 Fusionlnsight HD 中,可以在哪里查看 MapReduce 应用程序的运行结果?
A. Fusionlnsight Manager 的 web 界面 B. Loader Web 界面
C. Solr web 界面 D. Yarn Web 界面
Answer: D
51.MapReduce 任务最终是在下列哪一项中被执行的?
A.NodeManager B.container C.ResourceManager D.AppMaster
Answer: B
52.Yarn 中哪个角色是管理单个节点资源(CPU/Memory)的?
A.NodeManager B.Resource Manager C.Data Node D.NameNode
Answer: A
53.下来哪些 Redis 命令属于原子操作?
A.INCR(将储存的数字值增一) B.HINCRBY(为哈希表 key 中的域 field 的值加上增量 increment)
C.LPUSH(对链表的 push 操作) D.以上都是
Answer: D
54.Fusionlnsigt HD 中,一个应用程序若要完成 Kerberos 安全认证,以下哪些选项是必须用到的?(多选)
A. krb5.conf 配置文件 B.在 Fusionlnsight Manager 上申请的用户账号
C.用户账号的 keytab 文件 D.jaas.conf 配置文件
Answer: ABC
54.对 HBase 的列族,可以设置如下哪些属性?(多选)
A.Versions B.TTL C.Coprocessor D.Compression
Answer: ABD
55.Fusionlnsight HD 中,哪些组件对外提供 SQL 或类 SQL 能力?(多选)
A.HBase B.Hive C.Spark D.Redis
Answer: BC
56.在线日志查询方案中,采用了?处理来完成计算工作,整个计算过程中,需要将中间计算结果暂时存放,下列哪
些组件适合存储中间计算结果?(多选)
A.HDfS B.HBase C.Kafka D.Redis
Answer: CD
剩余24页未读,继续阅读

















安全验证
文档复制为VIP权益,开通VIP直接复制

评论2