A.去掉数据中的噪声
B.对数据进行汇总和聚集
C.使用概念分层,用高层次概念替换低层次“原始”数据
D.将属性按比例缩放,使之落入一个小的特定区间
您可能感兴趣的试卷
你可能感兴趣的试题
A.填补数据种的空缺值
B.集成多个数据源的数据
C.得到数据集的压缩表示
D.规范化数据
A.概念分层
B.离散化
C.分箱
D.直方图
A.孤立点
B.空缺值
C.测量变量中的随即错误或偏差
D.数据变换引起的错误
A.空间填充曲线
B.散点图矩阵
C.平行坐标
D.圆弓分割
A.标称属性
B.二元属性
C.序数属性
D.数值属性
A.算术平均值
B.截尾均值
C.中位数
D.众数
A.标称属性
B.二元属性
C.序数属性
D.数值属性
A.关联分析
B.分类和预测
C.聚类分析
D.演变分析
A.关联分析
B.分类和预测
C.聚类分析
D.演变分析
A.关联分析
B.分类和预测
C.演变分析
D.概念描述
最新试题
最大似然估计的一个缺点是,在某些情况下(例如,多项式分布),它可能会返回零的概率估计。
当反向传播算法运行到达到最小值时,无论初始权重是什么,总是会找到相同的解(即权重)。
如果P(A B)= P(A),则P(A∩B)= P(A)P(B)。
使用正则表达式可以找到一个文本文件中所有可能出现的手机号码。
完整性,一致性,时效性,唯一性,有效性,准确性是衡量数据质量的六个维度指标。
数据复制或者备份均是为了从提高数据并发这个角度来设计和实现的。
非结构化数据也可以使用关系型数据库来存储。
使决策树更深将确保更好的拟合度,但会降低鲁棒性。
随机梯度下降每次更新执行的计算量少于批梯度下降。
小数据集的数据处理最好也由计算机手段来完成。