多项选择题以下属于数据预处理的是()

A.缺失值填充
B.噪声数据剔除
C.异常值识别
D.数据可视化


您可能感兴趣的试卷

你可能感兴趣的试题

1.多项选择题大数据在今天这个时间点上爆发的原因有哪些?()

A.各种传感器无时无刻不在为我们提供大量的数据
B.各种监控设备无时无刻不在为我们提供大量的数据
C.各种智能设备无时无刻不在为我们提供大量的数据
D.互联网的收集和积累

2.多项选择题缺失值的处理方法有哪些?()

A.用平均值填充
B.忽略缺失记录
C.以任意数据填充
D.用默认值填充

3.多项选择题主成分分析计算选择相关系数计算法时,确定主成分个数的大致原则包括()

A.特征根值大于1
B.特征根值大于0.8
C.累积特征根值加总占总特征根值的80%以上
D.累积特征根值加总占总特征根值的90%以上

4.多项选择题以下属于数据规约方法的是()

A.数据离散化
B.数据标准化
C.噪声数据识别
D.数据压缩

5.单项选择题对于企业来说,数据使用的关键是()

A.数据收集
B.数据存储
C.数据分析
D.数据再利用

6.单项选择题智能健康手环的应用开发,体现了()的数据采集技术的应用。

A.统计报表
B.网络爬虫
C.API接口
D.传感器

7.单项选择题下列关于数据重组的说法中,错误的是()

A.数据重组是数据的重新生产和重新采集
B.数据重组能够使数据焕发新的光芒
C.数据重组实现的关键在于多源数据融合和数据集成
D.数据重组有利于实现新颖的数据模式创新

8.单项选择题下列关于计算机存储容量单位的说法中,错误的是()

A.1KB<;1MB<;1GB
B.基本的单位是字节(Byte)
C.一个汉字需要一个字节的存储空间
D.一个字节能够容纳一个英文字符

10.单项选择题因子分析的主要作用有()

A.对变量进行降维
B.对变量进行判别
C.对变量进行聚类
D.以上都不对