无法在合理时间内用常规【21】工具进行捕捉、管理和【22】并整理成可解读形式的数据集合称作“大数据(big data或mega data)”。 对于“大数据”,高德纳咨询公司(Gartner Group)给出的定义是:“大数据”是大量、高速、及/或多变的【23】 ,需要使用新型方式进行处理才能用以改善决策过程、助力深刻的发现并争取最优化处理(Big data are high volume,high velocity,and/or high variety information as sets that require new forms of processing to enable enhanced decision making,insight discovery and process optimization.)。 麦肯锡(McKinsey&Company)全球研究所认为大数据具有海量的数据【24】、快速的数据【25】、多样的数据【26】和价值密度低四大特征。 大数据技术的战略意义不在于【27】庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“【28】”。 从技术上看,大数据与【29】的关系就像一枚硬币的正反面一样密不可分。大数据必然无法用单台计算机进行处理,必须采用分布式架构。它的特色在于对海量数据进行分布式数据挖掘,依托云计算的分布式处理、分布式数据库和云存储、虚拟化技术。 随着云时代的来临,大数据也吸引了越来越多的关注。《著云台》的分析师团队认为,大数据通常用来形容一个公司创造的大量【30】数据和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。实时的大型数据集分析需要像MapReduce一样的框架来向数十、数百或甚至数千台电脑分配工作。 A处理 B存储 C读取 D非结构化 E分析 F管理 G规模 H回收利用 I结构化 J类型 K流转 L模型 M软件 N输送 O数量 P信息评估 Q信息资源 R信息资产 S硬件 T云技术 U云计算 V云盘 W运算 X再生 Y增值 Z掌握【21】