判断题在Spark中,因为DataFrame是比RDD更上层的接口,调用层次会更多。因此,所有基于DataFrame开发的程序的性能会比基于RDD开发的程序的性能差。()

您可能感兴趣的试卷

你可能感兴趣的试题

2.多项选择题下列关于HDFS客户端读文件过程正确的是?()

A.优先从最近的DataNode下载数据
B.文件数据先从DataNode返回至NameNode,然后从NameNode下致到客户端
C.如果客户端和所连接的DataNode在读取时出现故障,那么客户端会放弃这其他副本所在的节点
D.支持多个客户端同时从DataNode上读取同一个文件数据

6.多项选择题HDFS的应用开发中,下列哪些是HDFS服务支持的接口?()

A.BufferedOutputStream.write
B.BufferedOutputStream.flush
C.FileSystem.create
D.FileSystem.append

7.单项选择题Fusionlnsight HD中,假设一个拓扑,设置了spout并发度为3,bolt1并发度为2,bolt2并发度为3,worker数目为2,那么bolt1的executor在worker中是如何分布的?()

A.两个worker中的其中一个worker分布两个
B.两个worker各分布一个
C.没有固定规律
D.两个worker都分布两个

9.多项选择题Fusionlnsight HD中,关于Hive和Sparksql,下列哪些叙述是正确的?()

A.两者都能对外ᨀ供SQL或类SQL能力
B.两者都能运行在MapReduce计算框架上
C.两者都能通过表字段和HBase字段映射的方式访问HBase上的数据
D.两者都能运行在Spark计算框架上