多项选择题下面哪个是RDD的特点()

A.可分区
B.可序列化
C.可修改
D.可持久化


您可能感兴趣的试卷

你可能感兴趣的试题

3.多项选择题下列关于聚类挖掘技术的说法中,正确的是?()

A.不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别
B.要求同类数据的内容相似度尽可能小
C.要求不同类数据的内容相似度尽可能小
D.与分类挖掘技术相似的是,都是要对数据进行分类处理

4.多项选择题Namenode在启动时自动进入安全模式,在安全模式阶段,说法正确的是:()

A.安全模式目的是在系统启动时检查各个DataNode上数据块的有效性
B.根据策略对数据块进行必要的复制或删除
C.当数据块最小百分比数满足的最小副本数条件时,会自动退出安全模式
D.文件系统允许有修改

5.多项选择题spark的有几种部署模式()

A.本地模式
B.standalone模式
C.spark on yarn模式
D.mesos模式

6.多项选择题下列关于舍恩伯格对大数据特点的说法中,正确的是?()

A.数据规模大
B.数据类型多样
C.数据处理速度快
D.数据价值密度高

7.多项选择题HFile数据格式中的KeyValue数据格式,下列选项描述正确的是?()

A.是byte[]数组
B.没有固定的结构
C.数据的大小是定长的
D.有固定的结构

8.多项选择题下面对LSM结构描述正确的是?()

A.顺序存储
B.直接写硬盘
C.需要将数据Flush到磁盘
D.是一种搜索平衡树

9.多项选择题下面哪些概念是HBase框架中使用的?()

A.HDFS
B.GridFS
C.Zookeeper
D.EXT3

10.多项选择题spark的四大组件包括下面哪几个?()

A.Spark Streaming
B.Mlib
C.Graphx
D.Spark R

最新试题

若获得数据分析需求,需要分析同一客群,产品改造对客户是否满意是否有显著差异,可以使用什么方法()

题型:单项选择题

基于对未来的预测和在可选策略集上得到的行动方案,称为()

题型:单项选择题

以下关于系统聚类的描述中,错误的是()

题型:单项选择题

根原因分析中问题理解的常用工具包括()

题型:多项选择题

问卷测量通常可以从态度测量、能力测量等角度测试用户评分,一般来说态度测量经常使用的量表是哪一类()

题型:单项选择题

下面关于选择何种机器学习建损思路,说法错误的是()

题型:单项选择题

对某商品抽样调查,抽取其中400个商品,其中98%的商品合格,以下描述正确的是()

题型:单项选择题

下列哪些方法有助于提高聚类的有效性()

题型:多项选择题

回归模型犹如一列火车,引擎牵引的列车节箱数受速度、动力等因素所限,并不能无限增加,否则这列火车会存在安全隐患,回归也存在这类由维度(列车节箱)所引起的安全问题,因此在数据挖掘的场景中,认为自变量的维度最好不要超出15个,那么控制自变量个数的方法主要是哪种()

题型:单项选择题

全国性大规模调查,通常需要多种抽样方法,而多段集群抽样(muti-stagecluster sampling)提供了多种整合技术,据此说法正确的是()

题型:单项选择题