数据挖掘工程师章节练习(2020.02.29)

来源:考试资料网
3.名词解释聚类
参考答案:是将物理或抽象对象的集合分组成为多个类或簇(cluster)的过程,使得在同一个簇中的对象之间具有较高的相似度,而不同簇...
参考答案:数据仓库是一种新的数据处理体系结构,是面向主题的、集成的、不可更新的(稳定性)、随时间不断变化(不同时间)的数据集合,为...
参考答案:

(1)定义在一个数据集中什么数据是不一致或者离群的数据。
(2)找出所定义的离群点的有效挖掘方法。

参考答案:因为数据仓库或数据集市的数据总是历史的数据,需要时间维来区别。
参考答案:可伸缩性;处理不同类型属性的能力;发现任意形状聚类的能力;减小对先验知识和用户自定义参数的依赖性;处理噪声数据的能力;可...