以下适用HDFS的场景有：（）_考试资料网

网站首页考试题库模拟考场智能家居网课试题

CDA数据分析师

题库首页每日一练章节练习

多项选择题以下适用HDFS的场景有：（）

A.超大文件处理
B.低延时的数据访问
C.使用廉价商用硬件
D.多用户写入，随机修改文件

点击查看答案

您可能感兴趣的试卷

你可能感兴趣的试题

1.多项选择题关于Hadoop单机模式和伪分布式模式的说法，错误的是：（）

A.两者都起守护进程，且守护进程运行在一台机器上
B.单机模式不使用HDFS，但加载守护进程
C.两者都不与守护进程交互，避免复杂性
D.后者比前者增加了HDFS输入输出以及可检查内存使用情况

点击查看答案

2.多项选择题使用Hbase的优势在于（）

A.相对Hive，Hbase支持随机查询
B.使用HDFS文件系统，让Hbase存储的扩展几乎随着节点数的增加线性扩展
C.Hbase能够使用分布式计算，短时间内完成TB、PB级的数据搜索
D.Hbase数据库数据块大小和HDFS数据库块大小一致更好

点击查看答案

3.多项选择题Mahout实现的聚类算法（）

A.K-means
B.Canopy
C.模糊K-Means聚类
D.狄利克雷聚类

点击查看答案

4.多项选择题按照远近程度来聚类需要明确两个距离（）

A.点和点之间的距离
B.类和类之间的距离
C.欧式距离
D.兰氏距离

点击查看答案

5.多项选择题下列哪些命令是Mahout中用于实现贝叶斯文本分类算法（）

A.seqdirectory
B.seq2sparse
C.trainnb
D.trainlogistic

点击查看答案

6.多项选择题下列关于大数据的分析理念的说法中，正确的是（）

A.在数据基础上倾向于全体数据而不是抽样数据
B.在分析方法上更注重相关分析而不是因果分析
C.在分析效果上更追究效率而不是绝对精确
D.在数据规模上强调相对数据而不是绝对数据

点击查看答案

7.多项选择题数据清洗的方法包括（）

A.缺失值处理
B.噪声数据清除
C.一致性检查
D.重复数据记录处理

点击查看答案

8.多项选择题 20Newsgroups数据集是机器学习研究中常用的标准数据集，它使用20个Usenet新闻单位上几个月发布的18828个消息，共18828个文件，如果对该数据集使用mahout进行文本分类，分类后得到的混淆矩阵中，部分结果如下图所示：图中第一行是类别名称，第二行是属于a类的分类情况（a类文本原有168篇），第三行是属于b类的分类情况（b类文本原有180篇），第四行是c类的分类情况（c类文本原有189篇），根据各行的分类情况，以下分析正确的是（）

A.分类算法对a类文本分类情况较好
B.分类算法对c类文本分类情况较好
C.分类算法对b类文本分类情况较好
D.分类算法对c类文本分类情况较差

点击查看答案

9.多项选择题SparkStreaming可以对多种数据源（）进行类似Map、Reduce和Join等复杂操作。

A.Kdfka
B.Flume
C.Twitter
D.Zero

点击查看答案

10.多项选择题以下属于MLlib中能够实的接口有（）

A.KMeans
B.SVMWithSGD
C.ALS
D.LinearRegressionWithSGD

点击查看答案