A.Cloudera公司推出,提供对HDFS、Hbase数据的高性能、低延迟的交互式SQL查询功能。
B.基于Hive,使用内存计算,兼顾数据仓库、具有实时、批处理、多并发等优点。
C.支持各种文件格式,如TEXTFILE 、SEQUENCEFILE 、orc、Parquet。
D.基于内存运算,不需要把中间结果写入磁盘,省掉了大量的I/O开销。
您可能感兴趣的试卷
你可能感兴趣的试题
A.map
B.reduce
C.partitionBy
D.key by
A.jobmanager
B.TaskManager
C.master
D.StandaloneSessionClusterEntrypoint
A.Tumbling Window(滚动窗口)
B.Sliding Window(滑动窗口)
C.Session Window(会话窗口)
D.Local Window(局部窗口)
A.local
B.standalone
C.yarn
D.mesos
A.RDD(Resilient distributed dataset)叫做弹性分布式数据集,是spark中最基本的数据抽象
B.Resilient:表示弹性的,弹性表示
C.Destributed:分布式,可以并行在集群计算
D.Dataset:就是一个集合,用于存放数据的
A.mapPartitions
B.lookup
C.mapPartitionsWithIndex
D.count
A.宽依赖
B.窄依赖
C.分区关系
D.继承关系
A."Hello"(0),"Hello"(5)
B."Hello".take(1),"Hello".reverse(0)
C."Hello"(1),"Hello"(5)
D."Hello".take(0), "Hello".takeRight(1)
A.import scala.math._
B.import sqrt
C.import math._
D.import math.sqrt
A.1
B.2
C.3
D.4
最新试题
如果我们现有一个安装2.6.5版本的hadoop集群,在不修改默认配置的情况下存储200个每个200M的文本文件,请问最终会在集群中产生多少个数据块(包括副本)?()
下列代码的运行结果是()。
配置Hadoop时,修改namenode进程所在节点的配置包含在哪一个配置文件中()。
下列哪种类型的文件不是HDFS集群的元数据存储格式?()
为了查看不断更新的日志文件,可以使用的指令是()。
scala中定义一个空的list应该选择下列哪个类型()。
Scala中如何定义常量()。
如何将root目录下file.tar.gz文件解压到/usr/local目录下。()
假如你想计划让系统自动在每个月的第一天早上4点钟执行一个维护工作,以下哪个cron是正确的?()
scala的函数参数的求值策略有哪些。()