A.先聚类,然后用同类的均值填充
B.距离均值大于三倍标准差的值使用三倍标准差的值替代
C.用均值填充
D.超出1.5倍IQR的值使用1.5倍IQR的值替代
您可能感兴趣的试卷
你可能感兴趣的试题
A.均值
B.额外增加一类标签表示缺失
C.中位数
D.众数
A.均值
B.最大值
C.中位数
D.众数
A.异常值处理
B.缺失值处理
C.预测结果可视化输出
D.理解业务背景
A.变量剔除
B.降维
C.更换模型
D.增添交互效应
A.朴素贝叶斯
B.线性回归
C.卷积神经网络
D.因子分析
A.K-Means
B.PCA
C.随机森林
D.KNN
A.模型的正确率(accurate)
B.模型的泛化能力(general)
C.模型的稳定性(stable)
D.模型的易理解性
A.朴素贝叶斯
B.决策树
C.主成分分析法
D.K-Means
A.分类(Classification)
B.聚类(Clustering)
C.回归(Regression)
D.关联(Association)
A.分类(Classification)
B.聚类(Clustering)
C.回归(Regression)
D.关联(Association)
最新试题
ROC曲线的x轴,实际上可以由每个阈值下混淆矩阵的()计算而来
属于簇有效性的监督度量是:()
以下算法中,属于无监督算法的是()
决策树(Decision Tree)算法,通常可以用来解决何种问题?()
以下哪些算法或模型是有监督学习算法?()
分类型变量的缺失值可以怎样填充?()
关于可决系数R^2,下列说法中正确的是?()
非频繁模式是指()。
测试样例x=(age=youth,income=medium,student=no,credit_rating=excellent),则P(Nox)=()
当遇到解释变量有多重共线性问题时,可以采取以下哪些方法以解决多重共线性问题:()