A.Hadoop+oracle+spark
B.Hadoop+sqoop+hive+spark
C.oracle+mahout
D.sql server+oracle+mahout
您可能感兴趣的试卷
你可能感兴趣的试题
A.金融
B.电信
C.互联网
D.公共管理
A.K_MEANS_PARALLEL
B.KMeansModel类实例
C.kmeans.epsilon
D.kmeans.test实例
A.seq2sparse
B.kmeans
C.trainnb
D.testnb
A.MEMORY_ONLY
B.MEMORY_ONLY_SER
C.MEMORY_AND_DISK
D.MEMORY_AND_DISK_SER
A.管理当前节点内存
B.不会运行业务逻辑代码
C.会运行业务逻辑代码
D.接收master分配过来的资源指令
A.控制整个application的生命周期
B.可以控制dagsheduler组件
C.可以控制taskscheduler组件
D.SparkContext为Spark的主要入口点
A.64M
B.75M
C.一个map读取64M,另外一个map读取11M
D.一个map读取11M,另外一个map读取64M
A.start-dfs.sh
B.stop-dfs.sh
C.sbin/mr-jobhistory-daemon.sh start historyserver
D.jps
A.hadoop namenode-jar
B.hadoop namenode-format
C.hadoop datanode-jar
D.hadoop datanode-format
A.regionserver
B.spark-env.sh
C.spark-defaults.conf
D.slaves
最新试题
在进行多元线性回归分析时,对于变量较多的情况下,可以选择变量筛选方法,下列不正确的是()
若想要对一个电商企业的产品销售状况和销售趋势进行数据可视化,最佳的图表表示方式为()
在系统聚类中,需要定义两个类之间的距离,下列哪种方法能够缓解异常值对计算距离造成的影响()
以下哪类不属于分层标签()
某商店为了计算商品的热销程度,可以通过计算商品的()
以下哪种方法可以用于分析面板数据()
近因分析阶段(现状问题描述)不能使用的图表类型是()
某手机生产商希望研发一款新型的手机及配置选项,需要对全国的目标用户进行调研,项目时间为一个月,经费20万,请问此时使用哪种调研方式比较合适()
下列哪些方法有助于提高聚类的有效性()
若获得数据分析需求,需要分析同一客群,产品改造对客户是否满意是否有显著差异,可以使用什么方法()