A.选择任务相关的数据
B.选择要挖掘的知识类型
C.模式的兴趣度度量
D.模式的可视化表示
您可能感兴趣的试卷
你可能感兴趣的试题
A.关联分析
B.分类和预测
C.孤立点分析
D.演变分析
E.概念描述
A.关联分析
B.分类和预测
C.聚类分析
D.孤立点分析
E.演变分析
A.所涉及的算法的复杂性
B.所涉及的数据量
C.计算结果的表现形式
D.是否使用了人工智能技术
A.目标市场分析
B.购物篮分析
C.模式识别
D.信用卡欺诈检测
A.二分K均值
B.MST
C.Chameleon
D.组平均
A.MIN(单链)
B.MAX(全链)
C.组平均
D.Chameleon
A.高维性
B.规模
C.稀疏性
D.噪声和离群点
A.精度
B.Rand统计量
C.Jaccard系数
D.召回率
A.轮廓系数
B.共性分类相关系数
C.熵
D.F度量
A.规则集的表达能力远不如决策树好
B.基于规则的分类器都对属性空间进行直线划分,并将类指派到每个划分
C.无法被用来产生更易于解释的描述性模型
D.非常适合处理类分布不平衡的数据集
最新试题
公司内部收集的数据不存在需要考虑数据隐私的环节。
对于文本数据和多媒体数据进行特征提取是为了方便对于这类数据的观察和理解。
选择用于k均值聚类的聚类数k的一种好方法是尝试k的多个值,并选择最小化失真度量的值。
无论质心的初始化如何,K-Means始终会给出相同的结果。
当MAP中使用的先验是参数空间上的统一先验时,MAP估计等于ML估计。
由于决策树学会了对离散值输出而不是实值函数进行分类,因此它们不可能过度拟合。
要将工作申请分为两类,并使用密度估计来检测离职申请人,我们可以使用生成分类器。
通常,当试图从大量观察中学习具有少量状态的HMM时,我们几乎总是可以通过允许更多隐藏状态来增加训练数据的可能性。
小数据集的数据处理最好也由计算机手段来完成。
给定用于2类分类问题的线性可分离数据集,线性SVM优于感知器,因为SVM通常能够在训练集上实现更好的分类精度。