A.从样本多的一类中,去掉一些样本,使各类样本数目接近
B.对样本少的一类补充样本,使各类样本数目接近
C.对于二分类的情况,可以根据正反类的比例来调整阈值
D.利用集成学习的方法来处理
您可能感兴趣的试卷
你可能感兴趣的试题
A.蛛网战略
B.集中化战略
C.结合-分离战略
D.逐渐一体化战略
A.大数据是数据量变积累达到质变的结果
B.数据的产生需要经历很长时间
C.我们每个人都是数据的制造者
D.当今的世界,基本上一切都可以用数字表达,所以叫数字化的世界
A.容易过拟合
B.类别过多时容易出现错误
C.对缺失值不敏感
D.难以解释
A.SVM的可解释性较差,无法给出决策树那样的规则
B.SVM算法既可以解决线性问题,又可以解决非线性问题
C.SVM算法既可以处理小样本问题,又可以处理大规模训练样本
D.任意核函数都可以将低维线性不可分数据映射到高维线性可分的情况,且效果没有任何区别
A.季节性
B.地点
C.时间
D.趋势
A.依据置信度,产生和选择候选集
B.通过迭代找到数据库中的所有频繁项集
C.利用频繁项集构造出满足用户最小置信度的关联规则
D.利用提升度找到强关联规则
A.普查
B.抽样
C.统计报表制度
D.重点调查
A.信息熵越大,样本集纯度越高
B.基尼指数越大,样本集纯度越高
C.信息熵越大,样本集纯度越低
D.基尼指数越大,样本集纯度越低
A.自由问答
B.倾向偏差询问
C.发问式面谈
D.限定选择
A、在加法模型中这四种成分缺少相互作用的影响力量
B、在加法模型中这四种成分保持着相互依存的关系
C、在乘法模型中这四种成分缺少相互作用的影响力量
D、在乘法模型中这四种成分保持着相互依存的关系