单项选择题以HDFS上master:9000/graphdata.txt中的数据创建图graphhdfs,其中graphdata.txt文本格式:121256132156。现将graphhdfs中每个节点的属性值变为原值的3倍,并查看其中的10个顶点,则以下选项正确的是()

A.val temp=graphhdfs.mapVertices((x1,x2)=>x2.toInt*3).vertices.take(10)
B.val temp=graphhdfs.mapEdges((x1,x2)=>x2.toInt*3).vertices.take(10)
C.val temp=graphhdfs.mapVertices(x=>x._2.toInt*3).vertices.take(10)
D.val temp=graphhdfs.map(x=>x._1.toInt*3).vertices.take(10)


您可能感兴趣的试卷

你可能感兴趣的试题

1.单项选择题关于SecondaryNameNode哪项是正确的?()

A.它是NameNode的热备
B.它对内存没有要求
C.它的目的是帮助NameNode合并编辑日志,减少NameNode启动时间
D.SecondaryNameNode应与NameNode部署到一个节点

4.单项选择题关于MapReduce计算框架,以下说法正确的是:()

A.MapReduce是一个离线的批处理计算框架
B.MapReduce是一个实时的流处理计算框架
C.MapReduce是一个内存计算框架
D.以上说法都正确

5.单项选择题运行如下的命令,将本地readme.txt文件拷贝到test目录中:()

A.hdfs dfs-cat test/readme.txt
B.hdfs dfs-put test/readme.txt
C.hdfs dfs-rm-R test/readme.txt
D.hdfs dfs-copyFromLocal readme.txt test

6.单项选择题HDFS文件系统有一个/作为根目录。运行如下哪个命令来列出在HDFS中新创建的目录的内容:()

A.hdfs dfs-ls test
B.hdfs dfs-mkdir test
C.hdfs dfs-cat test
D.hdfs dfs-put test

7.单项选择题LSM更能保证哪种操作的性能?()

A.读
B.写
C.随机读
D.合并

8.单项选择题HDFS是一个分布式文件系统,它允许用户使用shell命令操作文件系统。其中读取/user/hduser/file1.txt文件并打印到屏幕上的命令是:()

A.hdfs dfs-ls/user/hduser/file1.txt
B.hdfs dfs-mkdir/user/hduser/file1.txt
C.hdfs dfs-cat/user/hduser/file1.txt
D.hdfs dfs-put/user/hduser/file1.txt

9.单项选择题创建一个数据库表用以下哪一项()

A.UPDATE
B.CREATE
C.UPDATED
D.ALTER

10.单项选择题Hadoopfs中的-get和-put命令操作对象是:()

A.文件
B.目录
C.两者都是
D.两者都不是

最新试题

基于对未来的预测和在可选策略集上得到的行动方案,称为()

题型:单项选择题

以下哪类不属于分层标签()

题型:单项选择题

某奶茶店为了预测每天订单数,建立了一个线性回归模型,其中有一个自变量为天气类型(分类变量),分为晴、阴、雨、雪等4种类型,请问如何处理这种变量()

题型:单项选择题

统计软件处理的数据类型通常包括文本型、数值型、日期型等格式,那么分析师录制数据时,通常以哪种录入方式为主()

题型:单项选择题

某手机生产商希望研发一款新型的手机及配置选项,需要对全国的目标用户进行调研,项目时间为一个月,经费20万,请问此时使用哪种调研方式比较合适()

题型:单项选择题

市场调查经常需要使用问卷技术,下面有几种说法不正确的是()

题型:多项选择题

以下关于系统聚类的描述中,错误的是()

题型:单项选择题

全国性大规模调查,通常需要多种抽样方法,而多段集群抽样(muti-stagecluster sampling)提供了多种整合技术,据此说法正确的是()

题型:单项选择题

目前收集110份问卷,数据质量控制良好,需要分析用户推荐指数(1-100评分)的影响因素,其中包括行为类6个指标。请问一般使用什么统计方法来解决这类归因问题()

题型:单项选择题

回归模型犹如一列火车,引擎牵引的列车节箱数受速度、动力等因素所限,并不能无限增加,否则这列火车会存在安全隐患,回归也存在这类由维度(列车节箱)所引起的安全问题,因此在数据挖掘的场景中,认为自变量的维度最好不要超出15个,那么控制自变量个数的方法主要是哪种()

题型:单项选择题