单项选择题在MapReduce的Shuffle阶段,每个Reducer使用HTTP协议来从Mapper节点获取自己的partition。默认每个Reducer使用几个线程来获取Maper节点数据?()

A.3个
B.4个
C.5个
D.6个


您可能感兴趣的试卷

你可能感兴趣的试题

1.单项选择题关于MapReduce计算框架,以下说法正确的是:()

A.MapReduce是一个离线的批处理计算框架
B.MapReduce是一个实时的流处理计算框架
C.MapReduce是一个内存计算框架
D.以上说法都正确

2.单项选择题运行如下的命令,将本地readme.txt文件拷贝到test目录中:()

A.hdfs dfs-cat test/readme.txt
B.hdfs dfs-put test/readme.txt
C.hdfs dfs-rm-R test/readme.txt
D.hdfs dfs-copyFromLocal readme.txt test

3.单项选择题HDFS文件系统有一个/作为根目录。运行如下哪个命令来列出在HDFS中新创建的目录的内容:()

A.hdfs dfs-ls test
B.hdfs dfs-mkdir test
C.hdfs dfs-cat test
D.hdfs dfs-put test

4.单项选择题LSM更能保证哪种操作的性能?()

A.读
B.写
C.随机读
D.合并

5.单项选择题HDFS是一个分布式文件系统,它允许用户使用shell命令操作文件系统。其中读取/user/hduser/file1.txt文件并打印到屏幕上的命令是:()

A.hdfs dfs-ls/user/hduser/file1.txt
B.hdfs dfs-mkdir/user/hduser/file1.txt
C.hdfs dfs-cat/user/hduser/file1.txt
D.hdfs dfs-put/user/hduser/file1.txt

6.单项选择题创建一个数据库表用以下哪一项()

A.UPDATE
B.CREATE
C.UPDATED
D.ALTER

7.单项选择题Hadoopfs中的-get和-put命令操作对象是:()

A.文件
B.目录
C.两者都是
D.两者都不是

8.单项选择题Hadoopv2YARN中,负责管理一个单独节点内资源的服务是()

A.NodeManager
B.ResourceManager
C.NameNode
D.DataNode

9.单项选择题hdfs-site.xml中哪个主要属性决定数据存储的路径?()

A.dfs.name.dir
B.dfs.data.dir
C.fs.checkpoint.dir
D.dfs.url

10.单项选择题在大数据的单位中,PB称为”拍字节”,其中1PB指的是:()

A.1024KB
B.1024MB
C.1024GB
D.1024TB

最新试题

如果拿到一份数据,直接对这组数据建模型肯定会造成一系列的问题,因此是需要进行预分析,而关于预分析描述错误的是()

题型:单项选择题

能够用于总体估计的是()

题型:单项选择题

相比获得某市员工名单而言,获取某市的企业名单会容易的多,并以企业为单位随机抽样,重点调查某个企业,这样可以节省调研成本,请问这是哪种抽样方法()

题型:单项选择题

当对一份数据进行建模分析时,如果出现数据集变较多,而对应的样本数相对较少的情况,下列哪种处理方法不能提升模型的适用性()

题型:单项选择题

从加工方式区分,标签可以分为哪三类()

题型:多项选择题

以下哪个不属于根据麦肯锡问题分析方法中的分类()

题型:单项选择题

某商店为了计算商品的热销程度,可以通过计算商品的()

题型:单项选择题

统计分析涉及高维运算,因此需要对高维空间中的数据结构进行探索,以发现其内部的模式,但高维探索特别困难,所以因子分析可以将高维空间进行降维,然后探索其内部结构。下面有关因子分析说法错误的是()

题型:单项选择题

全国性大规模调查,通常需要多种抽样方法,而多段集群抽样(muti-stagecluster sampling)提供了多种整合技术,据此说法正确的是()

题型:单项选择题

某手机生产商希望研发一款新型的手机及配置选项,需要对全国的目标用户进行调研,项目时间为一个月,经费20万,请问此时使用哪种调研方式比较合适()

题型:单项选择题