现在人人都在说大数据,大数据这个概念从2008年8月由维克托·迈尔-舍恩伯格及肯尼斯·库克耶提出,但是什么是大数据,对于不同的人有不同的理解。
对资深码农来说
在资深码农看来,大数据就是一堆技术的集合,就是上面的图,第一感觉就是,靠,这么多技术怎么学,从哪里学起?
对学术男或市场来说
对学术男或市场来说,就需要有一个定义,没有一个定义感觉就是飘乎乎。
定义:大数据指的是传统数据处理应用软件不足以处理它们的大或复杂的数据集的术语。
总结为4V:其中3个是数据的特征,速度是技术的特征。
从“哲学”角度来说
大数据,不是随机样本,而是所有数据;不是精确性,而是混杂性;不是因果关系,而是相关关系。
没有为什么,就是根据大数据相关技术、复杂的算法得到的结果,就像典型的“啤酒和尿布”。该故事的传播源于20世纪90年代的美国沃尔玛连锁超市。故事是这样的:沃尔玛超市管理人员分析其销售数据时,竟然发现了一个十分令人难以理解的商业现象:在日常的生活中,“啤酒”与“尿布”这两件商品看上去风马牛不相及,但是经常会一起出现在美国消费者的同一个购物篮中。