单项选择题当HRegion中的StoreFile数目达到一定阈值时,就会触发HRegion的()

A.compact操作
B.split操作
C.flush操作
D.write操作


您可能感兴趣的试卷

你可能感兴趣的试题

1.单项选择题对于SparkStreaming与Storm,系列叙述错误的是()

A.二者同为大数据流式数据处理框架
B.SparkStreaming在吞吐量与集成性方面要优于Storm
C.SparkStreaming在数据处理的实时性要优于Storm
D.SparkStreming又称为准实时处理框架,对数据的处理延迟能够达到秒级别

2.单项选择题与MapReduce相比,Spark更适合处理以下哪种类型的任务()

A.较多迭代次数的长任务
B.较多迭代次数的短任务
C.较少迭代次数的长任务
D.较少迭代次数的短任务

3.单项选择题Spark Streaming组件的主要功能是()

A.海量数据的交互式查询
B.机器学习与数据挖掘
C.图计算
D.实时数据流处理

4.单项选择题Spark SQL组件的主要功能是()

A.海量数据的交互式查询
B.机器学习与数据挖掘
C.图计算
D.实时数据流处理

5.单项选择题hive的元数据存储在derby和mysql中有什么区别()

A.没区别
B.多会话
C.支持网络环境
D.数据库的区别

6.单项选择题下面哪个操作肯定是宽依赖()

A.map
B.flatMap
C.reduceByKey
D.sample

7.单项选择题Stage的Task的数量由什么决定()

A.Partition
B.Job
C.Stage
D.TaskScheduler

8.单项选择题在Spark中,DAGScheduler的输出形式为()

A.DAG图
B.Stage
C.TaskSet
D.Task

9.单项选择题Spark Streaming中批处理时间间隔是指()

A.系统将获取到的数据流封装成一个RDD的时间间隔
B.系统对数据流进行统计分析的时间间隔
C.系统对数据流进行统计分析的频率
D.系统作业处理的周期

最新试题

某商店为了计算商品的热销程度,可以通过计算商品的()

题型:单项选择题

近因分析阶段(现状问题描述)不能使用的图表类型是()

题型:单项选择题

全国性大规模调查,通常需要多种抽样方法,而多段集群抽样(muti-stagecluster sampling)提供了多种整合技术,据此说法正确的是()

题型:单项选择题

某手机生产商希望研发一款新型的手机及配置选项,需要对全国的目标用户进行调研,项目时间为一个月,经费20万,请问此时使用哪种调研方式比较合适()

题型:单项选择题

若获得数据分析需求,需要分析同一客群,产品改造对客户是否满意是否有显著差异,可以使用什么方法()

题型:单项选择题

如果拿到一份数据,直接对这组数据建模型肯定会造成一系列的问题,因此是需要进行预分析,而关于预分析描述错误的是()

题型:单项选择题

以下哪个不是分群标签的用途()

题型:单项选择题

统计分析涉及高维运算,因此需要对高维空间中的数据结构进行探索,以发现其内部的模式,但高维探索特别困难,所以因子分析可以将高维空间进行降维,然后探索其内部结构。下面有关因子分析说法错误的是()

题型:单项选择题

在系统聚类中,需要定义两个类之间的距离,下列哪种方法能够缓解异常值对计算距离造成的影响()

题型:单项选择题

下列哪些方法有助于提高聚类的有效性()

题型:多项选择题