在训练样本集中，对于训练样本数目不均衡的情况，处理方法妥当的是（）。

多项选择题在训练样本集中，对于训练样本数目不均衡的情况，处理方法妥当的是（）。

A.从样本多的一类中，去掉一些样本，使各类样本数目接近
B.对样本少的一类补充样本，使各类样本数目接近
C.对于二分类的情况，可以根据正反类的比例来调整阈值
D.利用集成学习的方法来处理

1.多项选择题下列战略中属于合资经营中的基本战略的是（）。

A.蛛网战略
B.集中化战略
C.结合-分离战略
D.逐渐一体化战略

2.不定项选择关于大数据的来源，以下理解正确的是（）。

A.大数据是数据量变积累达到质变的结果
B.数据的产生需要经历很长时间
C.我们每个人都是数据的制造者
D.当今的世界，基本上一切都可以用数字表达，所以叫数字化的世界

3.多项选择题决策树模型的缺点有（）。

A.容易过拟合
B.类别过多时容易出现错误
C.对缺失值不敏感
D.难以解释

4.多项选择题以下对SVM算法的描述中正确的是（）。

A.SVM的可解释性较差，无法给出决策树那样的规则
B.SVM算法既可以解决线性问题，又可以解决非线性问题
C.SVM算法既可以处理小样本问题，又可以处理大规模训练样本
D.任意核函数都可以将低维线性不可分数据映射到高维线性可分的情况，且效果没有任何区别

5.多项选择题时间序列的问题需考虑下列何者（）。

A.季节性
B.地点
C.时间
D.趋势

6.多项选择题关联分析一般分为两个步骤，分别为（）。

A.依据置信度，产生和选择候选集
B.通过迭代找到数据库中的所有频繁项集
C.利用频繁项集构造出满足用户最小置信度的关联规则
D.利用提升度找到强关联规则

7.多项选择题下列哪些是搜集数据的组织方式（）。

A.普查
B.抽样
C.统计报表制度
D.重点调查

8.多项选择题对于同一个样本集，下列说法正确是（）。

A.信息熵越大，样本集纯度越高
B.基尼指数越大，样本集纯度越高
C.信息熵越大，样本集纯度越低
D.基尼指数越大，样本集纯度越低

9.多项选择题面谈调查的询问方式一般有（）。

A.自由问答
B.倾向偏差询问
C.发问式面谈
D.限定选择

10.多项选择题一个时间序列由长期趋势、季节变动、循环波动和不规则波动四种成分构成，（）。

A、在加法模型中这四种成分缺少相互作用的影响力量
B、在加法模型中这四种成分保持着相互依存的关系
C、在乘法模型中这四种成分缺少相互作用的影响力量
D、在乘法模型中这四种成分保持着相互依存的关系