单项选择题决策树中的Information Gain的计算是用来?()
A.剪枝
B.使树成长
C.处理缺失值和异常值
D.砍树
您可能感兴趣的试卷
你可能感兴趣的试题
1.单项选择题ROC曲线凸向哪个角,代表模型越理想?()
A.左上角
B.右上角
C.左下角
D.右下角
2.单项选择题在建立线性回归(Linear Regression)之前我们可以利用何种方法挑选重要属性,以降低模型的复杂度?()
A.皮尔森相关系数
B.卡方检定
C.T-检定
D.Z-Score
3.单项选择题若数据量较大,下面哪种方式比较适合()
A.系统聚类
B.快速聚类(k-means)
C.A和B都可以
D.A和B都不可以
4.单项选择题变量的量纲比如以厘米或者米为单位对下面哪种方法会有影响()
A.方差分析
B.回归分析
C.聚类分析
D.主成分分析
5.单项选择题当时间序列数据点的一阶差分近似为一常数,可配合以下哪种预测模型()
A.直线
B.二次抛物线
C.三次抛物线
D.指数曲线
6.单项选择题已知事件A的概率P(A)=0.6,U为必然事件,则P(A+U)=1,P(AU)=()
A.0.4
B.0.6
C.0
D.1
7.单项选择题数据正规化(Data Normalization)是在知识发掘处理(Knowledge Discovery Process)中的哪一个阶段进行?()
A.数据清洗
B.数据选择
C.数据编码
D.数据扩充
8.单项选择题请问以下何者属于时间序列的问题?()
A.信用卡发卡银行侦测潜在的卡奴
B.基金经理人针对个股做出未来价格预测
C.电信公司将人户区分为数个群体
D.以上均不是
9.单项选择题假设{BCE}为一频繁项目集(Frequent Itemset),则根据Apriori Principle以下何者不是子频繁项目?()
A.BC
B.CE
C.C
D.CD
10.单项选择题分类变量使用以下哪个统计量进行缺失值填补较合适()
A.均值
B.最大值
C.众数
D.中位数