A.业务理解
B.建模预测
C.数据清洗
D.模型修正
您可能感兴趣的试卷
你可能感兴趣的试题
A.所有的有监督学习模型都不支持有缺失值的情况
B.遇到有缺失值的情况,优先考虑删除变量
C.对于分类数据,考虑使用均值填充
D.对于连续型数据,考虑使用均值填充
如果某个特征(feature)有大量的异常值,那么可以采用以下哪些方法处理?()
①盖帽法
②离散化
③转化为分类变量
A.①②③
B.①②
C.②③
D.①③
A.均值填充
B.盖帽法填充
C.众数填充
D.中位数填充
A.方差膨胀因子(VIF)
B.DW检验
C.观察残差自相关图
D.观察R2的大小
A.计算模型中的参数
B.预测未知数据
C.比较不同模型的预测准确度,以便选择模型
D.构建模型
A.有放回抽样
B.无放回抽样
C.取数据的前60%部分
D.取数据的后60%部分
A.箱形图
B.甘特图
C.雷达图
D.K线图
A.经过Z-Score Normalization处理后的数据,不可能再有小于0的值
B.经过Z-Score Normalization处理后的数据,不可能再有大于1的值
C.经过Min-Max Normalization处理后的数据,不可能再有小于0的值
D.经过Min-Max Normalization处理后的数据,可能还有大于1的值
数据清洗阶段,对于以下哪些处理方式可以用来处理缺失值?()
①用均值填充
②转换为哑变量(0,1),代表数据是否缺失
③使用回归模型去预测缺失值
A.①②③
B.②③
C.①③
D.①②
A.训练(Train)集
B.验证(Validation)集
C.检验(Test)集
D.以上都不用
最新试题
支持向量机(SVM)算法,通常可以用来解决何种问题?()
以下哪些方法属于对异常值或极端值的处理方法?()
在分类问题中,我们经常会遇到正负样本数据量不等的情况,比如正样本为10w条数据,负样本只有1w条数据,以下最合适的处理方法是()?
在一个二分类的分类预测问题中,如果二分类中的某一类占比超过80%,那么可以考虑哪些方法去改进?()
C4.5算法继承了ID3算法的优点,并在以下哪几方面对ID3算法进行了改进?()
分类型变量的缺失值可以怎样填充?()
选择模型时,可能需要考虑以下哪些因素?()
决策树(Decision Tree)算法,通常可以用来解决何种问题?()
以下几项中,可以归于知识发掘处理(Knowledge Discovery Process)中的数据清洗阶段的有()
属于簇有效性的监督度量是:()