A.ds上的操作都作用于其中的每个RDD上
B.ds.count结果返回一个RDD
C.ds.reduceByKey结果返回一个DStream类型实例
D.ds中的每个RDD是一个批处理时间间隔内SparkStreaming获取的实时数据.
您可能感兴趣的试卷
你可能感兴趣的试题
A.socketSteam
B.kafkaSteam
C.flumeSteam
D.twitterSteam
A.MapReduce
B.Coprocessor
C.BloomFilter
D.Filter
A.RDD是可读、写的
B.RDD是基于内存的高度首先的数据共享模型
C.RDD是基于磁盘的高度首先的数据共享模型
D.RDD之间的依赖关系分为宽依赖与窄依赖
A.能够对海量数据进行批处理
B.能够对海量数据进行流式计算
C.能够对海量数据进行交互式查询
D.能够对海量数据进行存储
A.实现Writable接口的类是值
B.实现WritableComparable
C.Hadoop的基本类型Text并不实现WritableComparable
D.键和值的数据类型可以超出Hadoop自身支持的基本类型
A.hadoop fs-copyFromLocal~/a.data/test-data/
B.hadoop fs-put~/a.data/test-data/
C.hdfs fs-copyFromLocal~/a.data/test-data/
D.hdfsd fs-copyFromLocal~/a.data/test-data/
A.cache和persist都是用于将一个RDD进行缓存的,这样在之后使用的过程中就不需要重新计算了,可以大大节省程序运行时间
B.cache只有一个默认的缓存级别MEMORY_ONLY
C.persist可调用cache,而cache可以根据情况设置缓存级别
D.executor执行的时候,默认60%做cache,40%做task操作,persist最根本的函数,最底层的函数
A.命名空间镜像
B.修改日志
C.数据块block
D.分片文件
A.大数据
B.硬件错误是常态
C.流式数据访问
D.简单一致性
A.可分区
B.可序列化
C.可修改
D.可持久化
最新试题
目前收集110份问卷,数据质量控制良好,需要分析用户推荐指数(1-100评分)的影响因素,其中包括行为类6个指标。请问一般使用什么统计方法来解决这类归因问题()
因果图的分析要点有哪些()
问题理解阶段事件还原工具是哪个()
以下哪种方法可以用于分析面板数据()
市场调查中的数据收集,涉及随机抽样样本采样,获取数据的过程需要考虑的因素,不包括哪一项()
近因分析阶段(现状问题描述)不能使用的图表类型是()
相比获得某市员工名单而言,获取某市的企业名单会容易的多,并以企业为单位随机抽样,重点调查某个企业,这样可以节省调研成本,请问这是哪种抽样方法()
能够用于总体估计的是()
统计软件处理的数据类型通常包括文本型、数值型、日期型等格式,那么分析师录制数据时,通常以哪种录入方式为主()
以下哪个不是分群标签的用途()