A.孤立点
B.空缺值
C.测量变量中的随即错误或偏差
D.数据变换引起的错误
您可能感兴趣的试卷
你可能感兴趣的试题
A.空间填充曲线
B.散点图矩阵
C.平行坐标
D.圆弓分割
A.标称属性
B.二元属性
C.序数属性
D.数值属性
A.算术平均值
B.截尾均值
C.中位数
D.众数
A.标称属性
B.二元属性
C.序数属性
D.数值属性
A.关联分析
B.分类和预测
C.聚类分析
D.演变分析
A.关联分析
B.分类和预测
C.聚类分析
D.演变分析
A.关联分析
B.分类和预测
C.演变分析
D.概念描述
A.选择任务相关的数据
B.选择要挖掘的知识类型
C.模式的兴趣度度量
D.模式的可视化表示
A.关联分析
B.分类和预测
C.孤立点分析
D.演变分析
E.概念描述
A.关联分析
B.分类和预测
C.聚类分析
D.孤立点分析
E.演变分析
最新试题
最大似然估计的一个缺点是,在某些情况下(例如,多项式分布),它可能会返回零的概率估计。
使用正则表达式可以找到一个文本文件中所有可能出现的手机号码。
小数据集的数据处理最好也由计算机手段来完成。
数据索引是保证数据处理高性能的软件角度的一种手段,不做数据索引的数据访问是线性访问,但是做了索引的数据访问会成倍的降低访问时间。
经常跟管理层打交道并进行有效地关于商业领域的讨论有助于数据科学项目的成功。
数据复制或者备份均是为了从提高数据并发这个角度来设计和实现的。
要将工作申请分为两类,并使用密度估计来检测离职申请人,我们可以使用生成分类器。
支持向量机不适合大规模数据。
假设属性的数量固定,则可以在时间上以线性方式学习基于高斯的贝叶斯最优分类器,而该数量是数据集中记录的数量。
非结构化数据也可以使用关系型数据库来存储。