单项选择题大数据时代的到来,使我们无法人为地去发现数据中的奥妙,与此同时,我们更应该注重数据中的相关关系,而不是因果关系。其中,数据之间的相关关系可以通过以下()算法直接挖掘。

A.K-means
B.BayesNetwork
C.C4.5
D.Apriori


您可能感兴趣的试卷

你可能感兴趣的试题

1.单项选择题以下属于关联分析的是()。

A.CPU性能预测
B.购物篮分析
C.自动判断鸢尾花类别
D.股票趋势建模

2.单项选择题关于Weka的文件类型描述错误的是()。

A.Weka可以打开文件格式有.arff、.csv、.xlsx
B.Weka处理的数据集类似于关系数据库横行实例,竖行属性
C.arff是ASCII文件,可以用Word等文本编辑器打开查看
D.@relation定义数据集名称,@data之后呈现实例,每一行就是一个实例

3.单项选择题以下()不是Weka的数据类型。

A.numeric
B.nominal
C.string
D.decimal

4.单项选择题关于Weka离散化说明正确的是()。

A.离散化是将数值属性转换为字符串型属性
B.有监督离散化有两种等宽和等频方法
C.等宽离散化是使实例分布均匀的
D.离散化包括无监督离散化和有监督离散化

8.单项选择题使用线性回归(LinearRegression)分类器和用M5P分类器对cpu.arff分别进行分类,由其输出的误差指标可知()。

A.LinearRegression的标准误差比M5P的标准误差小
B.LinearRegression的平均绝对误差比M5P的平均绝对误差小
C.LinearRegression的相对误差比M5P的相对误差小
D.LinearRegression的平均方根误差比M5P的平均方根误差大

9.单项选择题使用SimpleKMeans算法对天气数据集(weather.numeric.arff)进行聚类,保持默认参数,即3个簇以及欧氏距离。选择play属性为忽略属性,从结果中可知,下列选项中,()是错误。

A.这组数据用算法迭代四次
B.产生了三个中心点
C.聚合为3个簇,分别有7,3,4个实例
D.平方和误差为8.928

10.单项选择题使用EM算法对天气数据集(weather.numeric.arff)进行聚类,将numClusters设置为4,即簇数为4,其他参数保持默认值,忽略class属性,从结果中可知,下列选项中,()是错误的。

A.模型的最大似然估计值是-7.18
B.这组数据用算法迭代15次
C.第四个簇的先验概率是0.14
D.第四个簇的实例数为4