如果你面对的大数据都是结构化的数据，使用传统的数据库进行数据库查询和分析时，...

单项选择题如果你面对的大数据都是结构化的数据，使用传统的数据库进行数据库查询和分析时，数据库的反应速度很慢，在这种大数据应用场景下，正确的大数据技术解决方案是（）

A.Hadoop+oracle+spark
B.Hadoop+sqoop+hive+spark
C.oracle+mahout
D.sql server+oracle+mahout

1.单项选择题大数据的起源是以下哪个领域（）

A.金融
B.电信
C.互联网
D.公共管理

2.单项选择题使用sparkMLib进行K-means算法分析时，我们会调用KMeans.train方法对数据集进行聚类训练，该函数的返回值是（）

A.K_MEANS_PARALLEL
B.KMeansModel类实例
C.kmeans.epsilon
D.kmeans.test实例

3.单项选择题Mahout中进行大数据分析时，需要对数据进行聚类，其所使用的命令是（）

A.seq2sparse
B.kmeans
C.trainnb
D.testnb

4.单项选择题SPARK默认的存储级别是（）

A.MEMORY_ONLY
B.MEMORY_ONLY_SER
C.MEMORY_AND_DISK
D.MEMORY_AND_DISK_SER

5.单项选择题以下对Spark中Work的主要工作描述错误的是（）

A.管理当前节点内存
B.不会运行业务逻辑代码
C.会运行业务逻辑代码
D.接收master分配过来的资源指令

6.单项选择题以下关于SPARK中的spark context，描述错误的是：（）

A.控制整个application的生命周期
B.可以控制dagsheduler组件
C.可以控制taskscheduler组件
D.SparkContext为Spark的主要入口点

7.单项选择题HDFS有一个gzip文件大小75MB，客户端设置Block大小为64M。当运行MapReduce任务读取该文件时input split大小为多少（）

A.64M
B.75M
C.一个map读取64M，另外一个map读取11M
D.一个map读取11M，另外一个map读取64M

8.单项选择题以下哪个命令用来启动HDFS系统：（）

A.start-dfs.sh
B.stop-dfs.sh
C.sbin/mr-jobhistory-daemon.sh start historyserver
D.jps

9.单项选择题执行如下哪个命令，用来初始化name目录和data目录（）

A.hadoop namenode-jar
B.hadoop namenode-format
C.hadoop datanode-jar
D.hadoop datanode-format

10.单项选择题Standalone模式下配置Spark集群时，master节点的工作端口号需要在conf文件夹下的哪个文件指明（）

A.regionserver
B.spark-env.sh
C.spark-defaults.conf
D.slaves