在SparkStreaming中，以下哪些数据可以作为DStream的输入源...

多项选择题在SparkStreaming中，以下哪些数据可以作为DStream的输入源（）

A.socketSteam
B.kafkaSteam
C.flumeSteam
D.twitterSteam

点击查看答案

您可能感兴趣的试卷

你可能感兴趣的试题

1.多项选择题对HBase构建二级索引的实现方式有哪些？（）

A.MapReduce
B.Coprocessor
C.BloomFilter
D.Filter

点击查看答案

2.多项选择题以下对Spark中RDD叙述错误的是（）

A.RDD是可读、写的
B.RDD是基于内存的高度首先的数据共享模型
C.RDD是基于磁盘的高度首先的数据共享模型
D.RDD之间的依赖关系分为宽依赖与窄依赖

点击查看答案

3.多项选择题Spark是大数据的综合处理框架，其综合性体现为（）

A.能够对海量数据进行批处理
B.能够对海量数据进行流式计算
C.能够对海量数据进行交互式查询
D.能够对海量数据进行存储

点击查看答案

4.多项选择题MapReduce框架ᨀ供了一种序列化键/值对的方法，支持这种序列化的类能够在Map和Reduce过程中充当键或值，以下说法正确的是：（）

A.实现Writable接口的类是值
B.实现WritableComparable接口的类可以是值或键
C.Hadoop的基本类型Text并不实现WritableComparable接口
D.键和值的数据类型可以超出Hadoop自身支持的基本类型

点击查看答案

5.多项选择题如果要将一个本地用户主目录下的数据文件a.data，上传到HDFS文件系统的/test-data/目录下，执行以下哪些命令可以实现？（）

A.hadoop fs-copyFromLocal~/a.data/test-data/
B.hadoop fs-put~/a.data/test-data/
C.hdfs fs-copyFromLocal~/a.data/test-data/
D.hdfsd fs-copyFromLocal~/a.data/test-data/

点击查看答案

6.多项选择题cache和pesist的描述，正确的是（）

A.cache和persist都是用于将一个RDD进行缓存的，这样在之后使用的过程中就不需要重新计算了，可以大大节省程序运行时间
B.cache只有一个默认的缓存级别MEMORY_ONLY
C.persist可调用cache，而cache可以根据情况设置缓存级别
D.executor执行的时候，默认60%做cache，40%做task操作，persist最根本的函数，最底层的函数

点击查看答案

7.多项选择题在HDFS中，NameNode是用来管理文件系统的命名空间的。它将所有的文件和文件夹的元数据保存在一个文件系统树中。这些信息也会在硬盘上保存成以下文件：（）

A.命名空间镜像
B.修改日志
C.数据块block
D.分片文件

点击查看答案

8.多项选择题以下哪些项是HDFS（Hadoop分布式文件系统）设计的前景和目标？（）

A.大数据
B.硬件错误是常态
C.流式数据访问
D.简单一致性

点击查看答案

9.多项选择题下面哪个是RDD的特点（）

A.可分区
B.可序列化
C.可修改
D.可持久化

点击查看答案&解析

10.多项选择题在MRv2中，Container是一个动态资源分配单位，将相关的资源封装在一起，包括（），从而限定每个任务的资源量

A.内存
B.磁盘
C.CPU
D.IP地址

点击查看答案