下面哪些问题是我们进行数据预处理的原因？（）

多项选择题下面哪些问题是我们进行数据预处理的原因？（）

A.数据中的空缺值
B.噪声数据
C.数据中的不一致性
D.数据中的概念分层

1.单项选择题哪种数据变换的方法将数据沿概念分层向上汇总？（）

A.平滑
B.聚集
C.数据概化
D.规范化

2.单项选择题下面哪种数据预处理技术可以用来平滑数据，消除数据噪声？（）

A.数据清理
B.数据集成
C.数据变换
D.数据归约

3.单项选择题进行数据规范化的目的是（）。

A.去掉数据中的噪声
B.对数据进行汇总和聚集
C.使用概念分层，用高层次概念替换低层次“原始”数据
D.将属性按比例缩放，使之落入一个小的特定区间

4.单项选择题数据归约的目的是（）。

A.填补数据种的空缺值
B.集成多个数据源的数据
C.得到数据集的压缩表示
D.规范化数据

5.单项选择题（）通过将属性域划分为区间，从而减少给定连续值的个数。

A.概念分层
B.离散化
C.分箱
D.直方图

6.单项选择题数据的噪声是指（）。

A.孤立点
B.空缺值
C.测量变量中的随即错误或偏差
D.数据变换引起的错误

7.单项选择题下列哪种可视化方法可用于发现多维数据中属性之间的两两相关性？（）

A.空间填充曲线
B.散点图矩阵
C.平行坐标
D.圆弓分割

8.单项选择题字段Hair_color={auburn，black，blond，brown，grey，red，white}属于哪种属性类型？（）

A.标称属性
B.二元属性
C.序数属性
D.数值属性

9.单项选择题计算一个单位的平均工资，使用哪个中心趋势度量将得到最合理的结果？（）

A.算术平均值
B.截尾均值
C.中位数
D.众数

10.单项选择题字段Size={small，medium，large}属于哪种属性类型？（）

A.标称属性
B.二元属性
C.序数属性
D.数值属性