多项选择题随机森林利用随机的方式将许多决策树组合成一个森林,每个决策树在分类的时候决定测试样本的最终类别。它的优点是()

A.能够处理高纬度的数据,并且不做特征选择
B.每次学习使用不同训练集,一定程度避免过拟合
C.在某些噪音较大的分类或回归问题上不会过拟合
D.级别划分较多的属性不会影响模型效果


您可能感兴趣的试卷

你可能感兴趣的试题

1.多项选择题在数据挖掘中,以下哪三种算法应用最为广泛()

A.决策树算法
B.回归算法
C.聚类分析
D.神经网络算法

2.单项选择题集中性能系统的数据源不包括()

A.信令CDR数据
B.话务统计数据
C.综合资源数据
D.业务营销数据

3.单项选择题当目标是连续变量时,该决策树是()

A.分类树
B.回归数
C.二分数
D.多分树

4.单项选择题基于数据挖掘分析,开展业务质量分析的分析与预判时,下列哪项说法是错误的()

A.当业务质量分析的样本流量太大,可以结合计算资源能力,通过合理比例的样本抽样,开展指标计算与分析
B.对于业务质量的指标分析,选取单个用户的业务访问xdr,即可计算该业务的指标情况,评估该业务是否存在内容资源质差
C.不同业务的质量指标通常存在一定差值,该现象与各业务的业务特性、用户行为、内容资源差异等多个因素有关,属于正常现象
D.业务质量分析中,通常结合业务指标的历史值(如该指标上周均值)与指标的固定阈值(如成功率是否低于90%),来作为是否出现质差或者劣化的判断依据

5.单项选择题Tableau是广义数据挖掘中的哪一类工具()

A.数据清洗
B.数据存储
C.可视化
D.数据建模

6.单项选择题不属于数据挖掘的功能是()

A.分类区隔类
B.推测预测类
C.序列规则类
D.人工智能类

7.单项选择题下面关于维的概念哪个是不正确的()

A.维是人们观察数据的特定角度
B.维的层次性是由观察数据细致程度不同造成的
C.“某年某月某日”是时间维的层次
D.“月、季、年”是时间维的层次

8.单项选择题在自然演化体系结构中,关于导致数据缺乏可信性的原因的说法哪个不正确()

A.数据无时基
B.抽取程序的算法有差异
C.抽取的层次不同
D.缺乏集成性

10.单项选择题物联网端到端质量分析应用中,业务接入成功率定界流程的dns解析环境,Resultcode=2代表的问题描述是()

A.格式错误,无法解析
B.域名服务器错误
C.DNS不支持该请求
D.域名不存在的查询