在一个二分类的分类预测问题中，如果二分类中的某一类占比超过80%，那么可以考...

多项选择题在一个二分类的分类预测问题中，如果二分类中的某一类占比超过80%，那么可以考虑哪些方法去改进？（）

A.改变模型，例如使用朴素贝叶斯等对偏斜不敏感的模型
B.升采样
C.降采样
D.盖帽法

1.多项选择题以下哪些方法属于对异常值或极端值的处理方法？（）

A.先聚类，然后用同类的均值填充
B.距离均值大于三倍标准差的值使用三倍标准差的值替代
C.用均值填充
D.超出1.5倍IQR的值使用1.5倍IQR的值替代

2.多项选择题分类型变量的缺失值可以怎样填充？（）

A.均值
B.额外增加一类标签表示缺失
C.中位数
D.众数

3.多项选择题离散型变量使用以下哪个统计量进行缺失值填补较合适？（）

A.均值
B.最大值
C.中位数
D.众数

4.多项选择题以下几项中，可以归于知识发掘处理（Knowledge Discovery Process）中的数据清洗阶段的有（）

A.异常值处理
B.缺失值处理
C.预测结果可视化输出
D.理解业务背景

5.多项选择题当遇到解释变量有多重共线性问题时，可以采取以下哪些方法以解决多重共线性问题：（）

A.变量剔除
B.降维
C.更换模型
D.增添交互效应

6.多项选择题以下算法中，属于有监督算法的是（）

A.朴素贝叶斯
B.线性回归
C.卷积神经网络
D.因子分析

7.多项选择题以下算法中，属于无监督算法的是（）

A.K-Means
B.PCA
C.随机森林
D.KNN

8.多项选择题选择模型时，可能需要考虑以下哪些因素？（）

A.模型的正确率（accurate）
B.模型的泛化能力（general）
C.模型的稳定性（stable）
D.模型的易理解性

9.多项选择题以下哪些算法或模型是有监督学习算法？（）

A.朴素贝叶斯
B.决策树
C.主成分分析法
D.K-Means

10.多项选择题支持向量机（SVM）算法，通常可以用来解决何种问题？（）

A.分类（Classification）
B.聚类（Clustering）
C.回归（Regression）
D.关联（Association）