A.需要编码为数值变量 B.需要编码为字符变量 C.需要编码为二分变量 D.需要编码为分类变量
A.DAG图 B.Stage C.TaskSet D.Task
A.完全相同B.完全相反C.完全相关D.不确定
A.对因变量取自然对数 B.对自变量取自然对数 C.将模型的常数项强制为0 D.对因变量乘以某一个系数a,进行放大或者缩小
A.两者都起守护进程,且守护进程运行在一台机器上 B.单机模式不使用HDFS,但加载守护进程 C.两者都不与守护进程交互,避免复杂性 D.后者比前者增加了HDFS输入输出以及可检查内存使用情况
A.训练(Train)集 B.验证(Validation)集 C.检验(Test)集 D.以上都不用
A.模型的整体预测准确率很高,因此可以认为模型结果是可靠的 B.有必要进一步查看混淆矩阵 C.有必要查看正负样本比例 D.反欺诈问题中,运用简单随机抽样是欠妥的
A.存储实际的KeyValue数据 B.存储数据的起点 C.指定字段的长度 D.存储数据块的起点
A.先用全数据的均值填充缺失值,然后随机分割训练集、测试集 B.先随机分割训练集、测试集,然后用各自集合的均值填充缺失值 C.先随机分割训练集、测试集,然后用训练集的均值填充缺失值 D.先随机分割训练集、测试集,然后用测试集的均值填充缺失值
A.多项式核函数 B.logistic核函数 C.径向基核函数 D.Sigmoid核函数