A.平滑
B.聚集
C.数据概化
D.规范化
您可能感兴趣的试卷
你可能感兴趣的试题
A.数据清理
B.数据集成
C.数据变换
D.数据归约
A.去掉数据中的噪声
B.对数据进行汇总和聚集
C.使用概念分层,用高层次概念替换低层次“原始”数据
D.将属性按比例缩放,使之落入一个小的特定区间
A.填补数据种的空缺值
B.集成多个数据源的数据
C.得到数据集的压缩表示
D.规范化数据
A.概念分层
B.离散化
C.分箱
D.直方图
A.孤立点
B.空缺值
C.测量变量中的随即错误或偏差
D.数据变换引起的错误
A.空间填充曲线
B.散点图矩阵
C.平行坐标
D.圆弓分割
A.标称属性
B.二元属性
C.序数属性
D.数值属性
A.算术平均值
B.截尾均值
C.中位数
D.众数
A.标称属性
B.二元属性
C.序数属性
D.数值属性
A.关联分析
B.分类和预测
C.聚类分析
D.演变分析
最新试题
数据压缩与解压缩可以使得数据处理的速度加快。
小数据集的数据处理最好也由计算机手段来完成。
根据数据科学家与数据工程师对于问题的理解并相互讨论,然后确定需要收集数据的范围以及种类,然后数据工程师使用数据收集工具,架构,甚至编程的形式来进行数据收集的工作,然后并把数据收集的数据放置到对应的存储系统。
数据索引就像给每条数据装了个信箱。
由于分类是回归的一种特殊情况,因此逻辑回归是线性回归的一种特殊情况。
通过统计学可以推测掷两个撒子同时选中3点的几率。
数据存储体系中并不牵扯计算机网络这一环节。
选择用于k均值聚类的聚类数k的一种好方法是尝试k的多个值,并选择最小化失真度量的值。
由于决策树学会了对离散值输出而不是实值函数进行分类,因此它们不可能过度拟合。
无论质心的初始化如何,K-Means始终会给出相同的结果。