A.数据越多越好
B.尽可能多的适合的数据
C.数据越少越好
D.以上三条都不正确
您可能感兴趣的试卷
你可能感兴趣的试题
A.买B商品的顾客中,有60%的顾客会同时购买A
B.同时购买AB两商品的顾客,占所有顾客的60%
C.买A商品的顾客中,有60%的顾客会同时购买B
D.两商品AB在交易数据库中同时被购买的机率为60%
A.聚类
B.分类
C.时间序列
D.关联规则
A.直接使用该变量
B.根据是否缺失,生成指示变量,仅使用指示变量作为解释变量
C.使用多重插补的方法进行缺失值填补
D.直接删除该变量
A.违反了建模的假设条件
B.加大了处理的难度
C.无法针对分区后各个数据集的特征分别做数据清洗
D.无法对不同数据清理的方法进行比较,以选择最优方法
A.123
B.=123
C.+123
D.*123
A.0.82
B.0.85
C.0.80
D.0.75
A.一定存在一个最优的分类
B.聚类分析是无监督学习
C.聚类分析可以用于判断异常值
D.聚类分析即:物以类聚,人以群分
A.人口基本数据,比如年龄和性别
B.基本社会状态数据,比如收入和职业
C.业务数据,比如消费频次
D.业务数据的衍生变量,比如最近3个月消费频次的变化情况
A.购买频次
B.购买金额
C.最后一次购买时间
D.购买金额波动率
A.可采用算术平均数
B.可以采用众数或中位数
C.只能采用众数
D.只能采用四分位数
最新试题
时间序列的问题需考虑下列何者()。
关于大数据的来源,以下理解正确的是()。
时间序列会受()因素共同作用。
以下企业核心竞争力系统的组织部分,正确的是()。
下列战略中属于合资经营中的基本战略的是()。
关于logistic回归的说法中不正确的是()。
相比其他决策分类模型,随机森林算法模型的优点有()。
当买方资产专用性高,而卖方资产专用性低时,卖方企业选择的战略不是以下哪几项()。
因子分析的作用是()。
在训练样本集中,对于训练样本数目不均衡的情况,处理方法妥当的是()。