单项选择题考虑如下场景:在M/R系统中,-HDFS块的大小是128MB-输入数据格式是FileInputFormat-我们有2个文件,大小分别为64Mb和200Mb问:Hadoop框架将启动几个mapper进程进行处理?()

A.2个
B.3个
C.4个
D.5个


您可能感兴趣的试卷

你可能感兴趣的试题

1.单项选择题linux中,哪个目录存放用户密码信息()

A./boot
B./etc
C./var
D./dev

2.单项选择题HBase是面向()的数据库。

A.行
B.列
C.网络
D.内存

5.单项选择题关于Tableau,以下说法错误的是()

A.Tableau支持多种格式数据,包括平面文件(比如Execl,txt文本),或者是数据
B.支持多表关联
C.使用Tableau分析数据,比传统的数据库查询快10到100倍
D.Tableau不能查询Hadoop

6.单项选择题向数据表中更新一条记录用以下哪一项()

A.CREATE
B.INSERT
C.SAVE
D.UPDATE

8.单项选择题在Hadoop客户端ᨀ交数据到HDFS上时,数据文件会被分片(split),最佳的分片策略是()

A.等于两个HDFS的block块大小
B.等于一个HDFS的block块大小
C.等于操作系统的文件块大小
D.大小无所谓

9.单项选择题下面哪项工作场景不是MapReduce计算框架擅长处理的?()

A.分析web日志记录,分析用户的行为
B.实时分析微博热词
C.分析气象数据,找出有历史记录以来每年的最高气温
D.购物篮分析,分析用户购买商品的关联度

10.单项选择题HBase分布式模式最好需要()个节点?

A.1
B.2
C.3
D.最少

最新试题

相比获得某市员工名单而言,获取某市的企业名单会容易的多,并以企业为单位随机抽样,重点调查某个企业,这样可以节省调研成本,请问这是哪种抽样方法()

题型:单项选择题

若想要对一个电商企业的产品销售状况和销售趋势进行数据可视化,最佳的图表表示方式为()

题型:单项选择题

回归模型犹如一列火车,引擎牵引的列车节箱数受速度、动力等因素所限,并不能无限增加,否则这列火车会存在安全隐患,回归也存在这类由维度(列车节箱)所引起的安全问题,因此在数据挖掘的场景中,认为自变量的维度最好不要超出15个,那么控制自变量个数的方法主要是哪种()

题型:单项选择题

如果拿到一份数据,直接对这组数据建模型肯定会造成一系列的问题,因此是需要进行预分析,而关于预分析描述错误的是()

题型:单项选择题

问题理解阶段事件还原工具是哪个()

题型:单项选择题

以下哪个不是分群标签的用途()

题型:单项选择题

对某商品抽样调查,抽取其中400个商品,其中98%的商品合格,以下描述正确的是()

题型:单项选择题

因果图的分析要点有哪些()

题型:多项选择题

下面关于选择何种机器学习建损思路,说法错误的是()

题型:单项选择题

市场调查经常需要使用问卷技术,下面有几种说法不正确的是()

题型:多项选择题