对于SparkStreaming与Storm，系列叙述错误的是（）

单项选择题对于SparkStreaming与Storm，系列叙述错误的是（）

A.二者同为大数据流式数据处理框架
B.SparkStreaming在吞吐量与集成性方面要优于Storm
C.SparkStreaming在数据处理的实时性要优于Storm
D.SparkStreming又称为准实时处理框架，对数据的处理延迟能够达到秒级别

1.单项选择题与MapReduce相比，Spark更适合处理以下哪种类型的任务（）

A.较多迭代次数的长任务
B.较多迭代次数的短任务
C.较少迭代次数的长任务
D.较少迭代次数的短任务

2.单项选择题Spark Streaming组件的主要功能是（）

A.海量数据的交互式查询
B.机器学习与数据挖掘
C.图计算
D.实时数据流处理

3.单项选择题Spark SQL组件的主要功能是（）

A.海量数据的交互式查询
B.机器学习与数据挖掘
C.图计算
D.实时数据流处理

4.单项选择题hive的元数据存储在derby和mysql中有什么区别（）

A.没区别
B.多会话
C.支持网络环境
D.数据库的区别

5.单项选择题下面哪个操作肯定是宽依赖（）

A.map
B.flatMap
C.reduceByKey
D.sample

6.单项选择题Stage的Task的数量由什么决定（）

A.Partition
B.Job
C.Stage
D.TaskScheduler

7.单项选择题在Spark中，DAGScheduler的输出形式为（）

A.DAG图
B.Stage
C.TaskSet
D.Task

8.单项选择题Spark Streaming中批处理时间间隔是指（）

A.系统将获取到的数据流封装成一个RDD的时间间隔
B.系统对数据流进行统计分析的时间间隔
C.系统对数据流进行统计分析的频率
D.系统作业处理的周期

9.单项选择题下列哪个操作能够实现“基于窗口将DStream[（K，V）]中的值V按键K使用聚合函数func聚合得到新的DStream”（）

A.count
B.reduceByKeyAndWidow
C.countByValue
D.reduceByKey

10.单项选择题MLlibᨀ供的分布式矩阵中，不包含行、列索引信息的矩阵类型是（）

A.RowMatrix
B.IndexedRowMatrix
C.Matrix
D.CoordinateMatrix