A.KNN
B.线性回归
C.逻辑回归
D.K-Means
您可能感兴趣的试卷
你可能感兴趣的试题
A.二者都可以处理分类问题
B.二者都可以增加不同的正则化项
C.二者都是参数模型
D.SVM的处理方法是只考虑supportvectors,也就是和分类最相关的少数点,去学习分类器
A.有放回简单随机抽样
B.无放回简单随机抽样
C.分层抽样
D.整群抽样
A.数据清洗是否到位
B.数据理解是否有偏差
C.模型选择是否合适
D.参数调整是否合理
A.改变模型,例如使用朴素贝叶斯等对偏斜不敏感的模型
B.升采样
C.降采样
D.盖帽法
A.先聚类,然后用同类的均值填充
B.距离均值大于三倍标准差的值使用三倍标准差的值替代
C.用均值填充
D.超出1.5倍IQR的值使用1.5倍IQR的值替代
A.均值
B.额外增加一类标签表示缺失
C.中位数
D.众数
A.均值
B.最大值
C.中位数
D.众数
A.异常值处理
B.缺失值处理
C.预测结果可视化输出
D.理解业务背景
A.变量剔除
B.降维
C.更换模型
D.增添交互效应
A.朴素贝叶斯
B.线性回归
C.卷积神经网络
D.因子分析
最新试题
表3是由表2得到的,表3中M和N的值分别为?()表3
根据购物篮分析的目标,最有用的规则是那些具有高支持度、信度和ᨀ升度的规则,除此之外,也需要参考Lift(ᨀ升度),以下关于“Lift”说法正确的是()
离散型变量使用以下哪个统计量进行缺失值填补较合适?()
关于可决系数R^2,下列说法中正确的是?()
以下哪些算法或模型是有监督学习算法?()
在分类问题中,我们经常会遇到正负样本数据量不等的情况,比如正样本为10w条数据,负样本只有1w条数据,以下最合适的处理方法是()?
在整个随机森林的算法过程中,以下哪两个随机过程可使随机森林很大程度上避免了过拟合现象的出现?()
以下算法中,属于无监督算法的是()
利用Apriori算法计算频繁项集可以有效降低计算频繁集的时间复杂度。在以下的购物篮中产生支持度不小于3的候选3-项集,在候选2-项集中需要剪枝的是()
在统计模式识分类问题中,当先验概率未知时,可以使用()?