A.能够对海量数据进行批处理
B.能够对海量数据进行流式计算
C.能够对海量数据进行交互式查询
D.能够对海量数据进行存储
您可能感兴趣的试卷
你可能感兴趣的试题
A.实现Writable接口的类是值
B.实现WritableComparable
C.Hadoop的基本类型Text并不实现WritableComparable
D.键和值的数据类型可以超出Hadoop自身支持的基本类型
A.hadoop fs-copyFromLocal~/a.data/test-data/
B.hadoop fs-put~/a.data/test-data/
C.hdfs fs-copyFromLocal~/a.data/test-data/
D.hdfsd fs-copyFromLocal~/a.data/test-data/
A.cache和persist都是用于将一个RDD进行缓存的,这样在之后使用的过程中就不需要重新计算了,可以大大节省程序运行时间
B.cache只有一个默认的缓存级别MEMORY_ONLY
C.persist可调用cache,而cache可以根据情况设置缓存级别
D.executor执行的时候,默认60%做cache,40%做task操作,persist最根本的函数,最底层的函数
A.命名空间镜像
B.修改日志
C.数据块block
D.分片文件
A.大数据
B.硬件错误是常态
C.流式数据访问
D.简单一致性
A.可分区
B.可序列化
C.可修改
D.可持久化
A.内存
B.磁盘
C.CPU
D.IP地址
A.core-site.xml
B.hdfs-site.xml
C.mapred-site.xml
D.yarn-site.xm
A.不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别
B.要求同类数据的内容相似度尽可能小
C.要求不同类数据的内容相似度尽可能小
D.与分类挖掘技术相似的是,都是要对数据进行分类处理
A.安全模式目的是在系统启动时检查各个DataNode上数据块的有效性
B.根据策略对数据块进行必要的复制或删除
C.当数据块最小百分比数满足的最小副本数条件时,会自动退出安全模式
D.文件系统允许有修改
最新试题
若想要对一个电商企业的产品销售状况和销售趋势进行数据可视化,最佳的图表表示方式为()
根原因分析中解决方案实施阶段包括哪些技术和工具()
在系统聚类中,需要定义两个类之间的距离,下列哪种方法能够缓解异常值对计算距离造成的影响()
若获得数据分析需求,需要分析同一客群,产品改造对客户是否满意是否有显著差异,可以使用什么方法()
问卷测量通常可以从态度测量、能力测量等角度测试用户评分,一般来说态度测量经常使用的量表是哪一类()
基于对未来的预测和在可选策略集上得到的行动方案,称为()
根原因消除工具不包括哪个()
近因分析阶段(现状问题描述)不能使用的图表类型是()
全国性大规模调查,通常需要多种抽样方法,而多段集群抽样(muti-stagecluster sampling)提供了多种整合技术,据此说法正确的是()
下面关于选择何种机器学习建损思路,说法错误的是()