A.直接使用该变量
B.根据是否缺失,生成指示变量,仅使用指示变量作为解释变量
C.使用多重插补的方法进行缺失值填补
D.直接删除该变量
您可能感兴趣的试卷
你可能感兴趣的试题
A.违反了建模的假设条件
B.加大了处理的难度
C.无法针对分区后各个数据集的特征分别做数据清洗
D.无法对不同数据清理的方法进行比较,以选择最优方法
A.123
B.=123
C.+123
D.*123
A.0.82
B.0.85
C.0.80
D.0.75
A.一定存在一个最优的分类
B.聚类分析是无监督学习
C.聚类分析可以用于判断异常值
D.聚类分析即:物以类聚,人以群分
A.人口基本数据,比如年龄和性别
B.基本社会状态数据,比如收入和职业
C.业务数据,比如消费频次
D.业务数据的衍生变量,比如最近3个月消费频次的变化情况
A.购买频次
B.购买金额
C.最后一次购买时间
D.购买金额波动率
A.可采用算术平均数
B.可以采用众数或中位数
C.只能采用众数
D.只能采用四分位数
A.数据库、数据库管理系统和用户
B.数据文件、命令文件和报表
C.数据库文件结构和数据
D.常量、变量和函数
A.DELETE
B.DROP
C.CLEAR
D.REMORE
最新试题
关于朴素贝叶斯算法,下列说法正确的是()。
时间序列的问题需考虑下列何者()。
测度数据集中趋势的指标可分为()两大类。
标准正态分布的期望值μ和标准差σ分别为()
用逻辑回归方法得到的分析结果中,其中预测为正类的有102个,其中78个预测正确。预测为负类的有115个,其中83个预测正确。那么正类的precision和recall各是多少()。
下列哪些是搜集数据的组织方式()。
建设投资包括()等。
相比其他决策分类模型,随机森林算法模型的优点有()。
关联分析一般分为两个步骤,分别为()。
有效的市场细分必须满足如下条件()。