单项选择题

如果某个特征(feature)有大量的异常值,那么可以采用以下哪些方法处理?()
①盖帽法
②离散化
③转化为分类变量

A.①②③
B.①②
C.②③
D.①③


您可能感兴趣的试卷

你可能感兴趣的试题

1.单项选择题对于离群值,一般采用什么方法处理()

A.均值填充
B.盖帽法填充
C.众数填充
D.中位数填充

2.单项选择题可以通过以下哪种方法,检验出多重共线性问题?()

A.方差膨胀因子(VIF)
B.DW检验
C.观察残差自相关图
D.观察R2的大小

3.单项选择题测试(Test)集通常用来()

A.计算模型中的参数
B.预测未知数据
C.比较不同模型的预测准确度,以便选择模型
D.构建模型

4.单项选择题在获取训练(Train)集时,一般使用什么方法?()

A.有放回抽样
B.无放回抽样
C.取数据的前60%部分
D.取数据的后60%部分

5.单项选择题如果准备观察单维数据的异常值,优先使用以下哪种图形?()

A.箱形图
B.甘特图
C.雷达图
D.K线图

6.单项选择题对于极值正规化(Min-Max Normalization)及Z-分数正规化(Z-Score Normalization)的结果,以下判断正确的是()

A.经过Z-Score Normalization处理后的数据,不可能再有小于0的值
B.经过Z-Score Normalization处理后的数据,不可能再有大于1的值
C.经过Min-Max Normalization处理后的数据,不可能再有小于0的值
D.经过Min-Max Normalization处理后的数据,可能还有大于1的值

8.单项选择题使用历史数据构造训练(Train)集、验证(Validation)集和检验(Test)集后,使用哪个数据集来训练模型?()

A.训练(Train)集
B.验证(Validation)集
C.检验(Test)集
D.以上都不用

9.单项选择题广为流传的“啤酒与尿布”的故事,其背后的模型实际上是哪一类?()

A.分类(Classification)
B.分群(Clustering)
C.关联(Association)
D.预测(Prediction)

10.单项选择题Apriori算法,最有可能可用来解决以下哪个问题?()

A.电子商务网站向顾客推荐商品的广告
B.信用卡欺诈识别
C.电信用户离网预警
D.预测GDP与工业产值之间的关系