A.compact操作
B.split操作
C.flush操作
D.write操作
您可能感兴趣的试卷
你可能感兴趣的试题
A.二者同为大数据流式数据处理框架
B.SparkStreaming在吞吐量与集成性方面要优于Storm
C.SparkStreaming在数据处理的实时性要优于Storm
D.SparkStreming又称为准实时处理框架,对数据的处理延迟能够达到秒级别
A.较多迭代次数的长任务
B.较多迭代次数的短任务
C.较少迭代次数的长任务
D.较少迭代次数的短任务
A.海量数据的交互式查询
B.机器学习与数据挖掘
C.图计算
D.实时数据流处理
A.海量数据的交互式查询
B.机器学习与数据挖掘
C.图计算
D.实时数据流处理
A.没区别
B.多会话
C.支持网络环境
D.数据库的区别
A.map
B.flatMap
C.reduceByKey
D.sample
A.Partition
B.Job
C.Stage
D.TaskScheduler
A.DAG图
B.Stage
C.TaskSet
D.Task
A.系统将获取到的数据流封装成一个RDD的时间间隔
B.系统对数据流进行统计分析的时间间隔
C.系统对数据流进行统计分析的频率
D.系统作业处理的周期
A.count
B.reduceByKeyAndWidow
C.countByValue
D.reduceByKey
最新试题
某商店为了计算商品的热销程度,可以通过计算商品的()
近因分析阶段(现状问题描述)不能使用的图表类型是()
全国性大规模调查,通常需要多种抽样方法,而多段集群抽样(muti-stagecluster sampling)提供了多种整合技术,据此说法正确的是()
某手机生产商希望研发一款新型的手机及配置选项,需要对全国的目标用户进行调研,项目时间为一个月,经费20万,请问此时使用哪种调研方式比较合适()
若获得数据分析需求,需要分析同一客群,产品改造对客户是否满意是否有显著差异,可以使用什么方法()
如果拿到一份数据,直接对这组数据建模型肯定会造成一系列的问题,因此是需要进行预分析,而关于预分析描述错误的是()
以下哪个不是分群标签的用途()
统计分析涉及高维运算,因此需要对高维空间中的数据结构进行探索,以发现其内部的模式,但高维探索特别困难,所以因子分析可以将高维空间进行降维,然后探索其内部结构。下面有关因子分析说法错误的是()
在系统聚类中,需要定义两个类之间的距离,下列哪种方法能够缓解异常值对计算距离造成的影响()
下列哪些方法有助于提高聚类的有效性()