单项选择题使用Pig的优势在于()

A.Pig可以使用一个类SQL的语言,降低了学习成本
B.Pig的语言编辑器可以把类SQL语言转换为一系列经过优化处理的MapReduce运算
C.目前Pig主要由开源社区维护
D.Pig是一种数据流语言


您可能感兴趣的试卷

你可能感兴趣的试题

1.单项选择题在Hbase中删除表t1的命令是()

A.drop table t1
B.truncate t1
C.drop‘t1’
D.truncate table t1

2.单项选择题下面与HDFS类似的框架是()

A.NTFS
B.FAT32
C.GFS
D.EXT3

3.单项选择题下面与Zookeeper类似的框架是()

A.Protobuf
B.Java
C.Kafka
D.Chubby

4.单项选择题HBase依赖()提供消息通信机制

A.Zookeeper
B.Chubby
C.RPC
D.Socket

5.单项选择题Mahout中实现的ALS-WR算法计算()后,就可以进行推荐了

A.评分矩阵(userXitem)A
B.用户特征矩阵U
C.物品特征矩阵M
D.U与M’的乘积A_k矩阵

6.单项选择题以HDFS上master:9000/graphdata.txt中的数据创建图graphhdfs,其中graphdata.txt文本格式:121256132156。现将graphhdfs中每个节点的属性值变为原值的3倍,并查看其中的10个顶点,则以下选项正确的是()

A.val temp=graphhdfs.mapVertices((x1,x2)=>x2.toInt*3).vertices.take(10)
B.val temp=graphhdfs.mapEdges((x1,x2)=>x2.toInt*3).vertices.take(10)
C.val temp=graphhdfs.mapVertices(x=>x._2.toInt*3).vertices.take(10)
D.val temp=graphhdfs.map(x=>x._1.toInt*3).vertices.take(10)

7.单项选择题关于SecondaryNameNode哪项是正确的?()

A.它是NameNode的热备
B.它对内存没有要求
C.它的目的是帮助NameNode合并编辑日志,减少NameNode启动时间
D.SecondaryNameNode应与NameNode部署到一个节点

10.单项选择题关于MapReduce计算框架,以下说法正确的是:()

A.MapReduce是一个离线的批处理计算框架
B.MapReduce是一个实时的流处理计算框架
C.MapReduce是一个内存计算框架
D.以上说法都正确

最新试题

根原因消除工具不包括哪个()

题型:单项选择题

某奶茶店为了预测每天订单数,建立了一个线性回归模型,其中有一个自变量为天气类型(分类变量),分为晴、阴、雨、雪等4种类型,请问如何处理这种变量()

题型:单项选择题

回归模型犹如一列火车,引擎牵引的列车节箱数受速度、动力等因素所限,并不能无限增加,否则这列火车会存在安全隐患,回归也存在这类由维度(列车节箱)所引起的安全问题,因此在数据挖掘的场景中,认为自变量的维度最好不要超出15个,那么控制自变量个数的方法主要是哪种()

题型:单项选择题

从加工方式区分,标签可以分为哪三类()

题型:多项选择题

近因分析阶段(现状问题描述)不能使用的图表类型是()

题型:单项选择题

市场调查中的数据收集,涉及随机抽样样本采样,获取数据的过程需要考虑的因素,不包括哪一项()

题型:多项选择题

以下哪个不是分群标签的用途()

题型:单项选择题

目前收集110份问卷,数据质量控制良好,需要分析用户推荐指数(1-100评分)的影响因素,其中包括行为类6个指标。请问一般使用什么统计方法来解决这类归因问题()

题型:单项选择题

对某商品抽样调查,抽取其中400个商品,其中98%的商品合格,以下描述正确的是()

题型:单项选择题

统计软件处理的数据类型通常包括文本型、数值型、日期型等格式,那么分析师录制数据时,通常以哪种录入方式为主()

题型:单项选择题