A.运算速度快,适用于具有较多迭代次数的算法 B.具有易用性,RDD中封装了大量的操作,ᨀ供了经典机器学习算法的API C.集成度高,能够与Spark上的其他组件进行无缝对接 D.运行原理是将Spark程序转换为MapReduce程序运行,并行度高
A.–input偏好数据路径 B.–output推荐结果路径 C.–clusters初始聚类中心点文件路径 D.--overwrite对输出路径进行重写
A.判断抽样 B.整群抽样 C.配额抽样 D.滚雪球抽样
A.改变模型,例如使用朴素贝叶斯等对偏斜不敏感的模型 B.升采样 C.降采样 D.盖帽法
A.均值 B.额外增加一类标签表示缺失 C.中位数 D.众数