多项选择题SparkStreaming可以对多种数据源()进行类似Map、Reduce和Join等复杂操作。

A.Kdfka
B.Flume
C.Twitter
D.Zero


您可能感兴趣的试卷

你可能感兴趣的试题

1.多项选择题以下属于MLlib中能够实的接口有()

A.KMeans
B.SVMWithSGD
C.ALS
D.LinearRegressionWithSGD

2.多项选择题对于MLlib中向量与LabledPoint,以下描述正确的是()

A.LabledPoint是一种基于向量扩展得到的数据结构
B.向量既可以是本地的也可以是分布式的
C.MLlib中既可以定义稀疏向量也可以定义密集向量
D.在LabledPoint中除了包含一个向量成员外,还包含一个Double类型的标识成员

3.多项选择题对MLlib的特点描述正确的是()

A.运算速度快,适用于具有较多迭代次数的算法
B.具有易用性,RDD中封装了大量的操作,ᨀ供了经典机器学习算法的API
C.集成度高,能够与Spark上的其他组件进行无缝对接
D.运行原理是将Spark程序转换为MapReduce程序运行,并行度高

4.多项选择题以下对于GraphX中triangleCount()的描述错误的是()

A.用以实现三角形计数功能
B.返回的数据是顶点集合
C.要求边是规范的指向(srcId〈dstId)
D.返回的数据是图

5.多项选择题对GraphX以下描述正确的是()

A.GraphX是一种基于内存的分布式的图计算框架与图计算库
B.GraphX中引入了弹性分布式属性图
C.GraphX实现了表视图与图视图的统一
D.GraphXᨀ供了丰富的PregelAPI用以实现经典的图计算算法

6.多项选择题令ds为SparkStreaming中DStream的一个实例,下列叙述正确的是()

A.ds上的操作都作用于其中的每个RDD上
B.ds.count结果返回一个RDD
C.ds.reduceByKey结果返回一个DStream类型实例
D.ds中的每个RDD是一个批处理时间间隔内SparkStreaming获取的实时数据.

7.多项选择题在SparkStreaming中,以下哪些数据可以作为DStream的输入源()

A.socketSteam
B.kafkaSteam
C.flumeSteam
D.twitterSteam

8.多项选择题对HBase构建二级索引的实现方式有哪些?()

A.MapReduce
B.Coprocessor
C.BloomFilter
D.Filter

9.多项选择题以下对Spark中RDD叙述错误的是()

A.RDD是可读、写的
B.RDD是基于内存的高度首先的数据共享模型
C.RDD是基于磁盘的高度首先的数据共享模型
D.RDD之间的依赖关系分为宽依赖与窄依赖

10.多项选择题Spark是大数据的综合处理框架,其综合性体现为()

A.能够对海量数据进行批处理
B.能够对海量数据进行流式计算
C.能够对海量数据进行交互式查询
D.能够对海量数据进行存储

最新试题

目前收集110份问卷,数据质量控制良好,需要分析用户推荐指数(1-100评分)的影响因素,其中包括行为类6个指标。请问一般使用什么统计方法来解决这类归因问题()

题型:单项选择题

若想要对一个电商企业的产品销售状况和销售趋势进行数据可视化,最佳的图表表示方式为()

题型:单项选择题

基于对未来的预测和在可选策略集上得到的行动方案,称为()

题型:单项选择题

当对一份数据进行建模分析时,如果出现数据集变较多,而对应的样本数相对较少的情况,下列哪种处理方法不能提升模型的适用性()

题型:单项选择题

能够用于总体估计的是()

题型:单项选择题

根原因分析中解决方案实施阶段包括哪些技术和工具()

题型:单项选择题

某手机生产商希望研发一款新型的手机及配置选项,需要对全国的目标用户进行调研,项目时间为一个月,经费20万,请问此时使用哪种调研方式比较合适()

题型:单项选择题

若获得数据分析需求,需要分析同一客群,产品改造对客户是否满意是否有显著差异,可以使用什么方法()

题型:单项选择题

问卷测量通常可以从态度测量、能力测量等角度测试用户评分,一般来说态度测量经常使用的量表是哪一类()

题型:单项选择题

从加工方式区分,标签可以分为哪三类()

题型:多项选择题