什么是“大数据”

Posted on Sun 15 July 2012 in it • Tagged with Big Data

上周五参加了第二届大数据世界论坛,第一个收获就是对什么是“大数据”有了基本的认识。 好几位演讲嘉宾都在slide中给出了自己对大数据的定义,通过综合比较下面4个厂商给出的定义,感觉其实业界对大数据还已经形成了定性的共识,但在定量方面貌似还有不小的差异。 下面归纳大家的共识,给出另外一版定义(定量部分仅供参考): 1. 背景 a) 从近几年数据量的增长趋势上看,预计到2020年世界数据量达到35.2ZB(10的21次方),比10年增加44倍; b) 从技术角度看,现有常规技术架构在处理这种规模的数据上面临很大挑战,业界需要新的技术手段能以足够经济的办法处理极端规模的数据量; c) 从业务角度看,大数据对应的收集、处理和分析过程没有发生根本改变,构建和运行大数据系统的投入必须要能够产生最够的价值才有意义 2. 对大数据的描述(6V) a) 大规模(Volume):数据量至少得到达PB(~10的15次方,1000T)的规模; b) 快速性(Velocity):短暂的决定时间和数据本身快速的变化是系统建设最大的挑战; c) 多样性(Variety):数据类型多样,给集成带来了很大的开销。一般来说我们需要构建结构化、半结构化和文件型数据并存的数据系统; d ...


Continue reading