多项选择题如何进行数据清洗()

A.填写缺失的值
B.平滑噪声数据
C.删除离群点
D.解决不一致性


您可能感兴趣的试卷

你可能感兴趣的试题

1.多项选择题大数据领域的主要开源生态体系包括()

A.Hadoop
B.Spark
C.YARN
D.HDFS

2.多项选择题自有业务质量监测及竞对分析对系统的需求主要分为哪些方面()

A.自有业务及竞品实时性能监控
B.开发相关统计报表支撑咪咕大数据报告编写
C.精准互联网营销
D.自有业务开启自动告警功能

3.多项选择题物联网端到端质量分析应用中网络接入时长定界流程,当下列哪些过程时延损耗较大需要转EPC进行处理()

A.鉴权
B.位置更新过程
C.被叫承载建立过程
D.默认承载建立过程
E.身份识别过程

4.多项选择题下列属于数据归纳方法的是()

A.数据立方体聚集
B.数据压缩
C.数值压缩
D.维归约
E.离散化和概念分层

5.多项选择题数据挖掘系统可以根据什么标准进行分类()

A.挖掘的数据库类型
B.挖掘的知识类型
C.挖掘所用的技术
D.应用

6.多项选择题高铁用户识别基于以下哪些信息()

A.专网TAC信息
B.用户速度判断
C.多普勒频移
D.进出站口公网TAC

7.多项选择题最优影响力模型选择标准是()

A.单指标相关性小
B.单指标相关性大
C.模型稳定性好
D.模型准确性高

8.多项选择题满意度分析建模数据来源于()

A.信令监测
B.经营分析
C.网管统计
D.客服支撑

9.多项选择题TOP终端分析的准确性在于()

A.终端库的准确性
B.终端库的实时性
C.终端库的完整性
D.信令数据IMEI字段解析

10.多项选择题Hbase集群的后台进程名称包括()

A.Hmaster
B.HRegionServer
C.Master
D.Slave