多项选择题MapReduce框架ᨀ供了一种序列化键/值对的方法,支持这种序列化的类能够在Map和Reduce过程中充当键或值,以下说法正确的是:()

A.实现Writable接口的类是值
B.实现WritableComparable接口的类可以是值或键
C.Hadoop的基本类型Text并不实现WritableComparable接口
D.键和值的数据类型可以超出Hadoop自身支持的基本类型


您可能感兴趣的试卷

你可能感兴趣的试题

1.多项选择题如果要将一个本地用户主目录下的数据文件a.data,上传到HDFS文件系统的/test-data/目录下,执行以下哪些命令可以实现?()

A.hadoop fs-copyFromLocal~/a.data/test-data/
B.hadoop fs-put~/a.data/test-data/
C.hdfs fs-copyFromLocal~/a.data/test-data/
D.hdfsd fs-copyFromLocal~/a.data/test-data/

2.多项选择题cache和pesist的描述,正确的是()

A.cache和persist都是用于将一个RDD进行缓存的,这样在之后使用的过程中就不需要重新计算了,可以大大节省程序运行时间
B.cache只有一个默认的缓存级别MEMORY_ONLY
C.persist可调用cache,而cache可以根据情况设置缓存级别
D.executor执行的时候,默认60%做cache,40%做task操作,persist最根本的函数,最底层的函数

4.多项选择题以下哪些项是HDFS(Hadoop分布式文件系统)设计的前景和目标?()

A.大数据
B.硬件错误是常态
C.流式数据访问
D.简单一致性

5.多项选择题下面哪个是RDD的特点()

A.可分区
B.可序列化
C.可修改
D.可持久化

8.多项选择题下列关于聚类挖掘技术的说法中,正确的是?()

A.不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别
B.要求同类数据的内容相似度尽可能小
C.要求不同类数据的内容相似度尽可能小
D.与分类挖掘技术相似的是,都是要对数据进行分类处理

9.多项选择题Namenode在启动时自动进入安全模式,在安全模式阶段,说法正确的是:()

A.安全模式目的是在系统启动时检查各个DataNode上数据块的有效性
B.根据策略对数据块进行必要的复制或删除
C.当数据块最小百分比数满足的最小副本数条件时,会自动退出安全模式
D.文件系统允许有修改

10.多项选择题spark的有几种部署模式()

A.本地模式
B.standalone模式
C.spark on yarn模式
D.mesos模式

最新试题

能够用于总体估计的是()

题型:单项选择题

某手机生产商希望研发一款新型的手机及配置选项,需要对全国的目标用户进行调研,项目时间为一个月,经费20万,请问此时使用哪种调研方式比较合适()

题型:单项选择题

如果拿到一份数据,直接对这组数据建模型肯定会造成一系列的问题,因此是需要进行预分析,而关于预分析描述错误的是()

题型:单项选择题

在进行多元线性回归分析时,对于变量较多的情况下,可以选择变量筛选方法,下列不正确的是()

题型:单项选择题

下面关于选择何种机器学习建损思路,说法错误的是()

题型:单项选择题

当对一份数据进行建模分析时,如果出现数据集变较多,而对应的样本数相对较少的情况,下列哪种处理方法不能提升模型的适用性()

题型:单项选择题

对某商品抽样调查,抽取其中400个商品,其中98%的商品合格,以下描述正确的是()

题型:单项选择题

相比获得某市员工名单而言,获取某市的企业名单会容易的多,并以企业为单位随机抽样,重点调查某个企业,这样可以节省调研成本,请问这是哪种抽样方法()

题型:单项选择题

从加工方式区分,标签可以分为哪三类()

题型:多项选择题

统计软件处理的数据类型通常包括文本型、数值型、日期型等格式,那么分析师录制数据时,通常以哪种录入方式为主()

题型:单项选择题