A.GraphX是一种基于内存的分布式的图计算框架与图计算库
B.GraphX中引入了弹性分布式属性图
C.GraphX实现了表视图与图视图的统一
D.GraphXᨀ供了丰富的PregelAPI用以实现经典的图计算算法
您可能感兴趣的试卷
你可能感兴趣的试题
A.ds上的操作都作用于其中的每个RDD上
B.ds.count结果返回一个RDD
C.ds.reduceByKey结果返回一个DStream类型实例
D.ds中的每个RDD是一个批处理时间间隔内SparkStreaming获取的实时数据.
A.socketSteam
B.kafkaSteam
C.flumeSteam
D.twitterSteam
A.MapReduce
B.Coprocessor
C.BloomFilter
D.Filter
A.RDD是可读、写的
B.RDD是基于内存的高度首先的数据共享模型
C.RDD是基于磁盘的高度首先的数据共享模型
D.RDD之间的依赖关系分为宽依赖与窄依赖
A.能够对海量数据进行批处理
B.能够对海量数据进行流式计算
C.能够对海量数据进行交互式查询
D.能够对海量数据进行存储
A.实现Writable接口的类是值
B.实现WritableComparable
C.Hadoop的基本类型Text并不实现WritableComparable
D.键和值的数据类型可以超出Hadoop自身支持的基本类型
A.hadoop fs-copyFromLocal~/a.data/test-data/
B.hadoop fs-put~/a.data/test-data/
C.hdfs fs-copyFromLocal~/a.data/test-data/
D.hdfsd fs-copyFromLocal~/a.data/test-data/
A.cache和persist都是用于将一个RDD进行缓存的,这样在之后使用的过程中就不需要重新计算了,可以大大节省程序运行时间
B.cache只有一个默认的缓存级别MEMORY_ONLY
C.persist可调用cache,而cache可以根据情况设置缓存级别
D.executor执行的时候,默认60%做cache,40%做task操作,persist最根本的函数,最底层的函数
A.命名空间镜像
B.修改日志
C.数据块block
D.分片文件
A.大数据
B.硬件错误是常态
C.流式数据访问
D.简单一致性
最新试题
根原因消除工具不包括哪个()
根原因分析中问题理解的常用工具包括()
对某商品抽样调查,抽取其中400个商品,其中98%的商品合格,以下描述正确的是()
市场调查中的数据收集,涉及随机抽样样本采样,获取数据的过程需要考虑的因素,不包括哪一项()
下列哪些方法有助于提高聚类的有效性()
在系统聚类中,需要定义两个类之间的距离,下列哪种方法能够缓解异常值对计算距离造成的影响()
统计分析涉及高维运算,因此需要对高维空间中的数据结构进行探索,以发现其内部的模式,但高维探索特别困难,所以因子分析可以将高维空间进行降维,然后探索其内部结构。下面有关因子分析说法错误的是()
以下哪个不是分群标签的用途()
若想要对一个电商企业的产品销售状况和销售趋势进行数据可视化,最佳的图表表示方式为()
若获得数据分析需求,需要分析同一客群,产品改造对客户是否满意是否有显著差异,可以使用什么方法()