多项选择题cache和pesist的描述,正确的是()

A.cache和persist都是用于将一个RDD进行缓存的,这样在之后使用的过程中就不需要重新计算了,可以大大节省程序运行时间
B.cache只有一个默认的缓存级别MEMORY_ONLY
C.persist可调用cache,而cache可以根据情况设置缓存级别
D.executor执行的时候,默认60%做cache,40%做task操作,persist最根本的函数,最底层的函数


您可能感兴趣的试卷

你可能感兴趣的试题

2.多项选择题以下哪些项是HDFS(Hadoop分布式文件系统)设计的前景和目标?()

A.大数据
B.硬件错误是常态
C.流式数据访问
D.简单一致性

3.多项选择题下面哪个是RDD的特点()

A.可分区
B.可序列化
C.可修改
D.可持久化

6.多项选择题下列关于聚类挖掘技术的说法中,正确的是?()

A.不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别
B.要求同类数据的内容相似度尽可能小
C.要求不同类数据的内容相似度尽可能小
D.与分类挖掘技术相似的是,都是要对数据进行分类处理

7.多项选择题Namenode在启动时自动进入安全模式,在安全模式阶段,说法正确的是:()

A.安全模式目的是在系统启动时检查各个DataNode上数据块的有效性
B.根据策略对数据块进行必要的复制或删除
C.当数据块最小百分比数满足的最小副本数条件时,会自动退出安全模式
D.文件系统允许有修改

8.多项选择题spark的有几种部署模式()

A.本地模式
B.standalone模式
C.spark on yarn模式
D.mesos模式

9.多项选择题下列关于舍恩伯格对大数据特点的说法中,正确的是?()

A.数据规模大
B.数据类型多样
C.数据处理速度快
D.数据价值密度高

10.多项选择题HFile数据格式中的KeyValue数据格式,下列选项描述正确的是?()

A.是byte[]数组
B.没有固定的结构
C.数据的大小是定长的
D.有固定的结构