多项选择题如何进行数据清洗()
A.填写缺失的值
B.平滑噪声数据
C.删除离群点
D.解决不一致性
您可能感兴趣的试卷
你可能感兴趣的试题
1.多项选择题大数据领域的主要开源生态体系包括()
A.Hadoop
B.Spark
C.YARN
D.HDFS
2.多项选择题自有业务质量监测及竞对分析对系统的需求主要分为哪些方面()
A.自有业务及竞品实时性能监控
B.开发相关统计报表支撑咪咕大数据报告编写
C.精准互联网营销
D.自有业务开启自动告警功能
3.多项选择题物联网端到端质量分析应用中网络接入时长定界流程,当下列哪些过程时延损耗较大需要转EPC进行处理()
A.鉴权
B.位置更新过程
C.被叫承载建立过程
D.默认承载建立过程
E.身份识别过程
4.多项选择题下列属于数据归纳方法的是()
A.数据立方体聚集
B.数据压缩
C.数值压缩
D.维归约
E.离散化和概念分层
5.多项选择题数据挖掘系统可以根据什么标准进行分类()
A.挖掘的数据库类型
B.挖掘的知识类型
C.挖掘所用的技术
D.应用
6.多项选择题高铁用户识别基于以下哪些信息()
A.专网TAC信息
B.用户速度判断
C.多普勒频移
D.进出站口公网TAC
7.多项选择题最优影响力模型选择标准是()
A.单指标相关性小
B.单指标相关性大
C.模型稳定性好
D.模型准确性高
8.多项选择题满意度分析建模数据来源于()
A.信令监测
B.经营分析
C.网管统计
D.客服支撑
9.多项选择题TOP终端分析的准确性在于()
A.终端库的准确性
B.终端库的实时性
C.终端库的完整性
D.信令数据IMEI字段解析
10.多项选择题Hbase集群的后台进程名称包括()
A.Hmaster
B.HRegionServer
C.Master
D.Slave
最新试题
给定一个数值属性,怎样才能平滑数据,去掉噪声?()
题型:多项选择题
如果购买铁锤的顾客中有70%的人购买了铁钉,那么置信度是()。
题型:单项选择题
GSP算法存在的问题包括()。
题型:多项选择题
关于ROC曲线和ROC统计量,正确的说法有()
题型:多项选择题
互联网本身具有()的特征,这种属性特征给数据搜集、整理、研究带来了革命性的突破。
题型:多项选择题
关联规则挖掘最为著名的是Agrawal等人提出的()及其改进算法。
题型:单项选择题
下列属于数据归纳方法的是()
题型:多项选择题
数据挖掘系统可以根据什么标准进行分类()
题型:多项选择题
随机森林利用随机的方式将许多决策树组合成一个森林,每个决策树在分类的时候决定测试样本的最终类别。它的优点是()
题型:多项选择题
Hbase集群的后台进程名称包括()
题型:多项选择题