通过对某地区的部分人群进行调查,获得了他们对于的age、income、是否为student、Credit_rating以及是否购买某品牌的电脑的信息进行了记录。训练样例如表1,通过训练样例得到表2,表3为根据表2的统计数据,得到的在分类为YES和NO的条件下各个属性值取得的概率以及YES和NO在所有样例中取值的概率。
表1
表3是由表2得到的,表3中M和N的值分别为?()
表3
A.9/14和0
B.1和1/5
C.9/14和1/5
D.0和1
您可能感兴趣的试卷
你可能感兴趣的试题
通过对某地区的部分人群进行调查,获得了他们对于的age、income、是否为student、Credit_rating以及是否购买某品牌的电脑的信息进行了记录。训练样例如表1,通过训练样例得到表2,表3为根据表2的统计数据,得到的在分类为YES和NO的条件下各个属性值取得的概率以及YES和NO在所有样例中取值的概率。
表1
表2是由表1的数据得到的,表2中的M和N的值应该分别为?()
表2
A.14和5
B.5和3
C.9和0
D.9和5
A.用训练集上的PCA模型处理测试集数据,然后把得到的数据输入到多元线性回归模型做预测。
B.用测试集上的PCA模型处理测试集数据,然后把得到的数据输入到多元线性回归模型做预测。
C.用全部数据集上的PCA模型处理测试集数据,然后把得到的数据输入到多元线性回归模型做预测。
D.以上皆可
A.先用全数据的均值填充缺失值,然后随机分割训练集、测试集
B.先随机分割训练集、测试集,然后用各自集合的均值填充缺失值
C.先随机分割训练集、测试集,然后用训练集的均值填充缺失值
D.先随机分割训练集、测试集,然后用测试集的均值填充缺失值
根据以下混淆矩阵和ROC曲线,回答以下两题:
A.A/(A+B)
B.A/(A+D)
C.B/(B+C)
D.C/(B+C)
根据以下混淆矩阵和ROC曲线,回答以下两题:
A.C/(C+D)
B.D/(A+D)
C.B/(B+C)
D.C/(B+C)
A.用来度量一类商品相对于它的一般购买率,此时被购买的可能性大小
B.不能避免不平衡数据标签的偏差性
C.Lift越大,数据质量越大
D.如果lift=1,说明两个事项有正向关联
A.其支持度小于阈值
B.都是不让人感兴趣的
C.包含负模式和负相关模式
D.对异常数据项敏感
A.轮廓系数
B.共性分类相关系数
C.熵
D.F度量
A.将负样本重复10次,生成10w样本量,打乱顺序参与分类
B.直接进行分类,可以最大限度利用数据
C.从10w正样本中随机抽取1w参与分类
D.将负样本每个权重设置为10,正样本权重为1,参与训练过程
A.最小损失准则
B.N-P判决
C.最小最大损失准则
D.最小误判概率准则
最新试题
在一个二分类的分类预测问题中,如果二分类中的某一类占比超过80%,那么可以考虑哪些方法去改进?()
在统计模式识分类问题中,当先验概率未知时,可以使用()?
在整个随机森林的算法过程中,以下哪两个随机过程可使随机森林很大程度上避免了过拟合现象的出现?()
ROC曲线的x轴,实际上可以由每个阈值下混淆矩阵的()计算而来
决策树(Decision Tree)算法,通常可以用来解决何种问题?()
如果一个回归模型分为两步:先使用PCA降维,然后用多元线性回归做预测,那么测试集的结果应当如何计算()
ROC曲线的y轴,实际上可以由每个阈值下混淆矩阵的()计算而来
测试样例x=(age=youth,income=medium,student=no,credit_rating=excellent),则P(Nox)=()
根据购物篮分析的目标,最有用的规则是那些具有高支持度、信度和ᨀ升度的规则,除此之外,也需要参考Lift(ᨀ升度),以下关于“Lift”说法正确的是()
以下算法中,属于有监督算法的是()