A.改变模型,例如使用朴素贝叶斯等对偏斜不敏感的模型
B.升采样
C.降采样
D.盖帽法
您可能感兴趣的试卷
你可能感兴趣的试题
A.先聚类,然后用同类的均值填充
B.距离均值大于三倍标准差的值使用三倍标准差的值替代
C.用均值填充
D.超出1.5倍IQR的值使用1.5倍IQR的值替代
A.均值
B.额外增加一类标签表示缺失
C.中位数
D.众数
A.均值
B.最大值
C.中位数
D.众数
A.异常值处理
B.缺失值处理
C.预测结果可视化输出
D.理解业务背景
A.变量剔除
B.降维
C.更换模型
D.增添交互效应
A.朴素贝叶斯
B.线性回归
C.卷积神经网络
D.因子分析
A.K-Means
B.PCA
C.随机森林
D.KNN
A.模型的正确率(accurate)
B.模型的泛化能力(general)
C.模型的稳定性(stable)
D.模型的易理解性
A.朴素贝叶斯
B.决策树
C.主成分分析法
D.K-Means
A.分类(Classification)
B.聚类(Clustering)
C.回归(Regression)
D.关联(Association)
最新试题
表3是由表2得到的,表3中M和N的值分别为?()表3
以下算法中,属于有监督算法的是()
测试样例x=(age=youth,income=medium,student=no,credit_rating=excellent),则P(Yesx)=()
在分类问题中,我们经常会遇到正负样本数据量不等的情况,比如正样本为10w条数据,负样本只有1w条数据,以下最合适的处理方法是()?
ROC曲线的x轴,实际上可以由每个阈值下混淆矩阵的()计算而来
决策树(Decision Tree)算法,通常可以用来解决何种问题?()
在整个随机森林的算法过程中,以下哪两个随机过程可使随机森林很大程度上避免了过拟合现象的出现?()
如果一个回归模型分为两步:先使用PCA降维,然后用多元线性回归做预测,那么测试集的结果应当如何计算()
测试样例x=(age=youth,income=medium,student=no,credit_rating=excellent),则P(Nox)=()
以下几项中,可以归于知识发掘处理(Knowledge Discovery Process)中的数据清洗阶段的有()