您可能感兴趣的试卷
你可能感兴趣的试题
A.折中法(rowkey设计兼顾A和B的业务需求)
B.冗余法(用空间换时间厂效率)
C.创立二级索引
D.预分region
A.Consumer主要进行数据消费
B.Consumer消费数据时需要指定Topic
C.多个Consumer配置相同的group.id时,这些Consumer消费的数据不会重
D.新ConsumerAPI消费数据不用指定ZooKeeper地址
A.从SolrAdminUI界面获取
B.在solr-example\confisolr-confisolr.properties中,已经默认带有这两个参数
C.从FusionlnsightManagerSolr服务配置界面获取
A.实时的在线数据分析
B.数据挖掘(用户行为分析,兴趣分析,区域展示)
C.数据汇总(每天/每周用户点击数,点击排行)
D.非实时分析(日志分析,统计分析)
A.流处理
B.高性能
C.可拓展
D.高容错
A.低时延
B.丰富的数据结构
C.支持数据持久化
D.支持SQL查询接口
A.Shell命令
B.JavaAPI
C.HueUI
D.RestAPI
A.设Smap输入的压缩方法
B.设置map输出的传递方式
C.设置map输出的压缩方法
D.设置reduce输出的压缩方法
A.访问权重高的属性值放在Rowkey前面
B.访问权重高的属性值放在Rowkey后半部分
C.离散度好的属性值放在Rowkey前半部分
D.离散度好的的属性值放在Rowkey后半部分
最新试题
存在如下业务场景:用户上网日志文件已经存放在HDFS上,日志文件内容格式是:每条上网记录三个字段,分别是姓名,性别,上网时间,字段之间用“,”护分隔;要求打印输出所有上网总时间大于两小时的女性网友。请问如下哪些代码片段能实现上述业务场景?()
Flume写入HDFS时,文件的生成当时有哪些?()
Spark Streaming可以从Kafka接收数据并进行计算,计算结果只能存入HDFS,不能再写回Kafka。()
Fusionlnsight HD支持通过哪些方式ᨀ交Oozie作业?()
由于Spark是基于内存的计算引擎,因此,一个Spark应用可以处理的数据量不能超过分给这个Spark应用的内存总和。()
Redis不适用与下面那些场景?()
在Kafka中,关于Consumer说法正确的是()。
在Solr的应用查询场景中,当对查询结果深度翻页时,需使用游标进行深度翻页。下面对游标说法正确的是?()
在MapReduce应用程序开发中,setMapOutputCompressorClass类的作用是什么?()
FusionlnsightHD系统中,关于HIve的JDBC接口类型,以下哪种叙述是正确的?()