如果某个特征(feature)有大量的异常值,那么可以采用以下哪些方法处理?()
①盖帽法
②离散化
③转化为分类变量
A.①②③
B.①②
C.②③
D.①③
您可能感兴趣的试卷
你可能感兴趣的试题
A.均值填充
B.盖帽法填充
C.众数填充
D.中位数填充
A.方差膨胀因子(VIF)
B.DW检验
C.观察残差自相关图
D.观察R2的大小
A.计算模型中的参数
B.预测未知数据
C.比较不同模型的预测准确度,以便选择模型
D.构建模型
A.有放回抽样
B.无放回抽样
C.取数据的前60%部分
D.取数据的后60%部分
A.箱形图
B.甘特图
C.雷达图
D.K线图
A.经过Z-Score Normalization处理后的数据,不可能再有小于0的值
B.经过Z-Score Normalization处理后的数据,不可能再有大于1的值
C.经过Min-Max Normalization处理后的数据,不可能再有小于0的值
D.经过Min-Max Normalization处理后的数据,可能还有大于1的值
数据清洗阶段,对于以下哪些处理方式可以用来处理缺失值?()
①用均值填充
②转换为哑变量(0,1),代表数据是否缺失
③使用回归模型去预测缺失值
A.①②③
B.②③
C.①③
D.①②
A.训练(Train)集
B.验证(Validation)集
C.检验(Test)集
D.以上都不用
A.分类(Classification)
B.分群(Clustering)
C.关联(Association)
D.预测(Prediction)
A.电子商务网站向顾客推荐商品的广告
B.信用卡欺诈识别
C.电信用户离网预警
D.预测GDP与工业产值之间的关系
最新试题
如果一个回归模型分为两步:先使用PCA降维,然后用多元线性回归做预测,那么测试集的结果应当如何计算()
以下哪些算法或模型是有监督学习算法?()
表2是由表1的数据得到的,表2中的M和N的值应该分别为?()表2
分类型变量的缺失值可以怎样填充?()
属于簇有效性的监督度量是:()
关于线性回归的描述,以下正确的有?()
以下算法中,属于有监督算法的是()
选择模型时,可能需要考虑以下哪些因素?()
离散型变量使用以下哪个统计量进行缺失值填补较合适?()
ROC曲线的y轴,实际上可以由每个阈值下混淆矩阵的()计算而来