A.HDFS
B.GridFS
C.Zookeeper
D.EXT3
您可能感兴趣的试卷
你可能感兴趣的试题
A.Spark Streaming
B.Mlib
C.Graphx
D.Spark R
A.两者不可或缺,MapReduce是HBase可以正常运行的保证
B.两者不是强关联关系,没有MapReduce,HBase可以正常运行
C.MapReduce可以直接访问HBase
D.它们之间没有任何关系
A.不是开源的
B.是面向列的
C.是分布式的
D.是一种NoSQL数据库
A.样本来自于总体
B.以样本推断总体
C.两者可以互换角色
D.以总体指标估计样本指标
A.FAT32
B.EXT3
C.FAT
D.NTFS
A.mahout kmenas-iinput/part-m-0000-ooutput-cclusters-k6-x7
B.mahout kmenas-iinput/part-m-0000-ooutput-cclusters-k7-x6
C.mahout kmenas-iinput/part-m-0000-ooutput-cclusters-x6
D.mahout kmenas-iinput/part-m-0000-ooutput-cclusters-k7
A.Hadoop+oracle+spark
B.Hadoop+sqoop+hive+spark
C.oracle+mahout
D.sql server+oracle+mahout
A.金融
B.电信
C.互联网
D.公共管理
A.K_MEANS_PARALLEL
B.KMeansModel类实例
C.kmeans.epsilon
D.kmeans.test实例
A.seq2sparse
B.kmeans
C.trainnb
D.testnb
最新试题
某奶茶店为了预测每天订单数,建立了一个线性回归模型,其中有一个自变量为天气类型(分类变量),分为晴、阴、雨、雪等4种类型,请问如何处理这种变量()
根原因分析中问题理解的常用工具包括()
下面关于选择何种机器学习建损思路,说法错误的是()
下列哪些方法有助于提高聚类的有效性()
相比获得某市员工名单而言,获取某市的企业名单会容易的多,并以企业为单位随机抽样,重点调查某个企业,这样可以节省调研成本,请问这是哪种抽样方法()
以下关于系统聚类的描述中,错误的是()
如果拿到一份数据,直接对这组数据建模型肯定会造成一系列的问题,因此是需要进行预分析,而关于预分析描述错误的是()
从加工方式区分,标签可以分为哪三类()
市场调查经常需要使用问卷技术,下面有几种说法不正确的是()
在系统聚类中,需要定义两个类之间的距离,下列哪种方法能够缓解异常值对计算距离造成的影响()