单项选择题Spark SQL组件的主要功能是()

A.海量数据的交互式查询
B.机器学习与数据挖掘
C.图计算
D.实时数据流处理


您可能感兴趣的试卷

你可能感兴趣的试题

1.单项选择题hive的元数据存储在derby和mysql中有什么区别()

A.没区别
B.多会话
C.支持网络环境
D.数据库的区别

2.单项选择题下面哪个操作肯定是宽依赖()

A.map
B.flatMap
C.reduceByKey
D.sample

3.单项选择题Stage的Task的数量由什么决定()

A.Partition
B.Job
C.Stage
D.TaskScheduler

4.单项选择题在Spark中,DAGScheduler的输出形式为()

A.DAG图
B.Stage
C.TaskSet
D.Task

5.单项选择题Spark Streaming中批处理时间间隔是指()

A.系统将获取到的数据流封装成一个RDD的时间间隔
B.系统对数据流进行统计分析的时间间隔
C.系统对数据流进行统计分析的频率
D.系统作业处理的周期

7.单项选择题MLlibᨀ供的分布式矩阵中,不包含行、列索引信息的矩阵类型是()

A.RowMatrix
B.IndexedRowMatrix
C.Matrix
D.CoordinateMatrix

8.单项选择题MLlib中创建稀疏矩阵((0.0,2.0),(3.0,0.0),(0.0,6.0))的语句是()

A.val dm:Matrix=Matrices.dense(3,2,Array(0.0,3.0,0.0,2.0,0.0,6.0))
B.val dm:Matrix=Matrices.sparse(3,2,Array(0.0,2.0,3.0,0.0,0.0,6.0))
C.val sm:Matrix=Matrices.sparse(3,2,Array(0,1,2),Array(1,0,1),Array(2,3,6))
D.val sm:Matrix=Matrices.dense(3,2,Array(0,1,2),Array(1,0,1),Array(2,3,6))

9.单项选择题基于密集向量(1.0,0.0,3.0)创建一个LabledPoint,设其标识值为1.0,以下正确的选项为()

A.val pos=LabeledPoint(1.0,Vectors.dense(1.0,0.0,3.0))
B.val pos=LabeledPoint(1.0,(1.0,0.0,3.0))
C.val pos=LabeledPoint(Vectors.dense(1.0,0.0,3.0),1.0)
D.val pos=LabeledPoint((1.0,0.0,3.0),1.0)

10.单项选择题val rdd=sc.parallelize(1to10).filter(_%2==0)rdd.collect上述代码的执行结果为()

A.Array(1,2,3,4,5,6,7,8,9,10)
B.Array(1,3,5,7,9)
C.Array(2,4,6,8,10)
D.Array(1,10)