多项选择题关于Hadoop单机模式和伪分布式模式的说法,错误的是:()

A.两者都起守护进程,且守护进程运行在一台机器上
B.单机模式不使用HDFS,但加载守护进程
C.两者都不与守护进程交互,避免复杂性
D.后者比前者增加了HDFS输入输出以及可检查内存使用情况


您可能感兴趣的试卷

你可能感兴趣的试题

1.多项选择题使用Hbase的优势在于()

A.相对Hive,Hbase支持随机查询
B.使用HDFS文件系统,让Hbase存储的扩展几乎随着节点数的增加线性扩展
C.Hbase能够使用分布式计算,短时间内完成TB、PB级的数据搜索
D.Hbase数据库数据块大小和HDFS数据库块大小一致更好

2.多项选择题Mahout实现的聚类算法()

A.K-means
B.Canopy
C.模糊K-Means聚类
D.狄利克雷聚类

3.多项选择题按照远近程度来聚类需要明确两个距离()

A.点和点之间的距离
B.类和类之间的距离
C.欧式距离
D.兰氏距离

4.多项选择题下列哪些命令是Mahout中用于实现贝叶斯文本分类算法()

A.seqdirectory
B.seq2sparse
C.trainnb
D.trainlogistic

5.多项选择题下列关于大数据的分析理念的说法中,正确的是()

A.在数据基础上倾向于全体数据而不是抽样数据
B.在分析方法上更注重相关分析而不是因果分析
C.在分析效果上更追究效率而不是绝对精确
D.在数据规模上强调相对数据而不是绝对数据

6.多项选择题数据清洗的方法包括()

A.缺失值处理
B.噪声数据清除
C.一致性检查
D.重复数据记录处理

9.多项选择题以下属于MLlib中能够实的接口有()

A.KMeans
B.SVMWithSGD
C.ALS
D.LinearRegressionWithSGD

10.多项选择题对于MLlib中向量与LabledPoint,以下描述正确的是()

A.LabledPoint是一种基于向量扩展得到的数据结构
B.向量既可以是本地的也可以是分布式的
C.MLlib中既可以定义稀疏向量也可以定义密集向量
D.在LabledPoint中除了包含一个向量成员外,还包含一个Double类型的标识成员