A.正确率Accuracy
B.覆盖率Recallf
C.命中率Precision
D.轮廓系数SilhouetteCoefficient
您可能感兴趣的试卷
你可能感兴趣的试题
A.用来度量一类商品相对于它的一般购买率,此时被购买的可能性大小
B.不能避免不平衡数据标签的偏差性
C.Lift越大,数据质量越大
D.如果lift=1,说明两个事项有正向关联
A.K-Means
B.PCA
C.随机森林
D.KNN
通过对某地区的部分人群进行调查,获得了他们对于的age、income、是否为student、Credit_rating以及是否购买某品牌的电脑的信息进行了记录。训练样例如表1,通过训练样例得到表2,表3为根据表2的统计数据,得到的在分类为YES和NO的条件下各个属性值取得的概率以及YES和NO在所有样例中取值的概率。
表1
表2是由表1的数据得到的,表2中的M和N的值应该分别为?()
表2
A.14和5
B.5和3
C.9和0
D.9和5
A.最小损失准则
B.N-P判决
C.最小最大损失准则
D.最小误判概率准则
A.变量剔除
B.降维
C.更换模型
D.增添交互效应
A.其支持度小于阈值
B.都是不让人感兴趣的
C.包含负模式和负相关模式
D.对异常数据项敏感
A.先聚类,然后用同类的均值填充
B.距离均值大于三倍标准差的值使用三倍标准差的值替代
C.用均值填充
D.超出1.5倍IQR的值使用1.5倍IQR的值替代
A.KNN
B.线性回归
C.逻辑回归
D.K-Means
通过对某地区的部分人群进行调查,获得了他们对于的age、income、是否为student、Credit_rating以及是否购买某品牌的电脑的信息进行了记录。训练样例如表1,通过训练样例得到表2,表3为根据表2的统计数据,得到的在分类为YES和NO的条件下各个属性值取得的概率以及YES和NO在所有样例中取值的概率。
表1
A.0.0132/(P(age=youth,income=medium,student=no,crediting_rating=excellent))
B.0.0132
C.0.067
D.0.568
A.模型的正确率(accurate)
B.模型的泛化能力(general)
C.模型的稳定性(stable)
D.模型的易理解性
最新试题
关于可决系数R^2,下列说法中正确的是?()
支持向量机(SVM)算法,通常可以用来解决何种问题?()
在整个随机森林的算法过程中,以下哪两个随机过程可使随机森林很大程度上避免了过拟合现象的出现?()
假定某同学使用Naive Bayesian(NB)分类模型时,不小心将训练数据的两个维度搞重复了,那么关于NB的说法中正确的是?()
以下哪些算法,可以用神经网络去构造?()
利用Apriori算法计算频繁项集可以有效降低计算频繁集的时间复杂度。在以下的购物篮中产生支持度不小于3的候选3-项集,在候选2-项集中需要剪枝的是()
离散型变量使用以下哪个统计量进行缺失值填补较合适?()
关于线性回归的描述,以下正确的有?()
测试样例x=(age=youth,income=medium,student=no,credit_rating=excellent),则P(Yesx)=()
表2是由表1的数据得到的,表2中的M和N的值应该分别为?()表2