A.PCA(主成分分析)
B.FA(因子分析)
C.MDS(多维尺度分析)
D.Apriori
您可能感兴趣的试卷
你可能感兴趣的试题
A.业务理解
B.建模预测
C.数据清洗
D.模型修正
A.所有的有监督学习模型都不支持有缺失值的情况
B.遇到有缺失值的情况,优先考虑删除变量
C.对于分类数据,考虑使用均值填充
D.对于连续型数据,考虑使用均值填充
如果某个特征(feature)有大量的异常值,那么可以采用以下哪些方法处理?()
①盖帽法
②离散化
③转化为分类变量
A.①②③
B.①②
C.②③
D.①③
A.均值填充
B.盖帽法填充
C.众数填充
D.中位数填充
A.方差膨胀因子(VIF)
B.DW检验
C.观察残差自相关图
D.观察R2的大小
A.计算模型中的参数
B.预测未知数据
C.比较不同模型的预测准确度,以便选择模型
D.构建模型
A.有放回抽样
B.无放回抽样
C.取数据的前60%部分
D.取数据的后60%部分
A.箱形图
B.甘特图
C.雷达图
D.K线图
A.经过Z-Score Normalization处理后的数据,不可能再有小于0的值
B.经过Z-Score Normalization处理后的数据,不可能再有大于1的值
C.经过Min-Max Normalization处理后的数据,不可能再有小于0的值
D.经过Min-Max Normalization处理后的数据,可能还有大于1的值
数据清洗阶段,对于以下哪些处理方式可以用来处理缺失值?()
①用均值填充
②转换为哑变量(0,1),代表数据是否缺失
③使用回归模型去预测缺失值
A.①②③
B.②③
C.①③
D.①②
最新试题
测试样例x=(age=youth,income=medium,student=no,credit_rating=excellent),则P(Nox)=()
利用Apriori算法计算频繁项集可以有效降低计算频繁集的时间复杂度。在以下的购物篮中产生支持度不小于3的候选3-项集,在候选2-项集中需要剪枝的是()
属于簇有效性的监督度量是:()
表2是由表1的数据得到的,表2中的M和N的值应该分别为?()表2
如果一个回归模型分为两步:先使用PCA降维,然后用多元线性回归做预测,那么测试集的结果应当如何计算()
ROC曲线的y轴,实际上可以由每个阈值下混淆矩阵的()计算而来
以下哪些算法或模型是有监督学习算法?()
关于缺失值填充与训练集、测试集的关系,下面正确的操作是()
如果整个数据分析模型完成后,发现效果不良,考虑从哪些步骤入手改进?()
在统计模式识分类问题中,当先验概率未知时,可以使用()?