单项选择题在Hadoop客户端ᨀ交数据到HDFS上时,数据文件会被分片(split),最佳的分片策略是()
A.等于两个HDFS的block块大小
B.等于一个HDFS的block块大小
C.等于操作系统的文件块大小
D.大小无所谓
您可能感兴趣的试卷
你可能感兴趣的试题
1.单项选择题下面哪项工作场景不是MapReduce计算框架擅长处理的?()
A.分析web日志记录,分析用户的行为
B.实时分析微博热词
C.分析气象数据,找出有历史记录以来每年的最高气温
D.购物篮分析,分析用户购买商品的关联度
2.单项选择题HBase分布式模式最好需要()个节点?
A.1
B.2
C.3
D.最少
3.单项选择题HBase虚拟分布式模式需要()个节点?
A.1
B.2
C.3
D.最少3个
4.单项选择题默认情况下,YARN支持下面哪个调度器。()
A.Fair scheduler
B.Capacity scheduler
C.FIFO调度器
D.DRT调度器
5.单项选择题HFile数据格式中的Magic字段用于()
A.存储随机数,防止数据损坏
B.存储数据的起点
C.存储数据块的起点
D.指定字段的长度
6.单项选择题HFile数据格式中的Data字段用于()
A.存储实际的KeyValue数据
B.存储数据的起点
C.指定字段的长度
D.存储数据块的起点
最新试题
因果图的分析要点有哪些()
题型:多项选择题
下列哪些方法有助于提高聚类的有效性()
题型:多项选择题
能够用于总体估计的是()
题型:单项选择题
目前收集110份问卷,数据质量控制良好,需要分析用户推荐指数(1-100评分)的影响因素,其中包括行为类6个指标。请问一般使用什么统计方法来解决这类归因问题()
题型:单项选择题
全国性大规模调查,通常需要多种抽样方法,而多段集群抽样(muti-stagecluster sampling)提供了多种整合技术,据此说法正确的是()
题型:单项选择题
基于对未来的预测和在可选策略集上得到的行动方案,称为()
题型:单项选择题
根原因分析中问题理解的常用工具包括()
题型:多项选择题
在系统聚类中,需要定义两个类之间的距离,下列哪种方法能够缓解异常值对计算距离造成的影响()
题型:单项选择题
以下哪个不是分群标签的用途()
题型:单项选择题
某商店为了计算商品的热销程度,可以通过计算商品的()
题型:单项选择题