利用Apriori算法计算频繁项集可以有效降低计算频繁集的时间复杂度。在以下的购物篮中产生支持度不小于3的候选3-项集,在候选2-项集中需要剪枝的是()
ID 项集
1 面包、牛奶
2 面包、尿布、啤酒、鸡蛋
3 牛奶、尿布、啤酒、可乐
4 面包、牛奶、尿布、啤酒
5 面包、牛奶、尿布、可乐
A.啤酒、尿布
B.啤酒、面包
C.面包、尿布
D.啤酒、牛奶
您可能感兴趣的试卷
你可能感兴趣的试题
A.等深分箱
B.等宽分箱
C.数据标准化
D.自定义区间法
A.缺失值填充
B.噪声数据剔除
C.异常值识别
D.数据可视化
A.各种传感器无时无刻不在为我们提供大量的数据
B.各种监控设备无时无刻不在为我们提供大量的数据
C.各种智能设备无时无刻不在为我们提供大量的数据
D.互联网的收集和积累
A.用平均值填充
B.忽略缺失记录
C.以任意数据填充
D.用默认值填充
A.特征根值大于1
B.特征根值大于0.8
C.累积特征根值加总占总特征根值的80%以上
D.累积特征根值加总占总特征根值的90%以上
A.数据离散化
B.数据标准化
C.噪声数据识别
D.数据压缩
A.数据收集
B.数据存储
C.数据分析
D.数据再利用
A.统计报表
B.网络爬虫
C.API接口
D.传感器
A.数据重组是数据的重新生产和重新采集
B.数据重组能够使数据焕发新的光芒
C.数据重组实现的关键在于多源数据融合和数据集成
D.数据重组有利于实现新颖的数据模式创新
A.1KB<;1MB<;1GB
B.基本的单位是字节(Byte)
C.一个汉字需要一个字节的存储空间
D.一个字节能够容纳一个英文字符
最新试题
投掷一颗骰子,令X表示出现的点数,那么{X≤4}表示的是()。
以下对于KNN算法的描述中正确的是()。
战略集团的三种用途()
一个时间序列由长期趋势、季节变动、循环波动和不规则波动四种成分构成,()。
以下哪些聚类分析的方法是利用统计学定义的距离进行度量的?()
因子分析的作用是()。
用逻辑回归方法得到的分析结果中,其中预测为正类的有102个,其中78个预测正确。预测为负类的有115个,其中83个预测正确。那么正类的precision和recall各是多少()。
关于logistic回归的说法中不正确的是()。
在训练样本集中,对于训练样本数目不均衡的情况,处理方法妥当的是()。
对于同一个样本集,下列说法正确是()。