《大数据时代》读后感
文/李达
我们生活在一个“概念”纷飞的年代,先前只有IBM熟谙的招数,如今已经“飞入平常百姓家”。“移动互联网”、“云计算”的概念刚刚消停,业界的专家又送来了“大数据”的概念,一时间似乎人人都变成了“大数据”专家,见面要是不提“大数据”都不好意思跟人打招呼!
玩笑归玩笑,当我们的存储能力、计算能力和网络带宽变得充裕之后,我们先前对待数据,尤其是原始数据的态度和思维方式,将面临着很大的改变!
其实,作者的主要观点,已经在翻译者的译者序中进行了总结:“大数据时代处理数据理念上的三大转变:要全体不要抽样,要效率不要绝对精确,要相关不要因果”。
如作者所言,“采样分析是信息缺乏时代和信息流通受限制的模拟数据时代的产物”。如果可以,我们当然会使用“全体数据”而不是“抽样数据”。读到这里,我估计大学里正在绞尽脑汁设计样本抽样方法的学生、教授们,连哭的心都有!
数据分析的及时性,在很多情况下比精确性更加重要,尤其是在商业领域。想想看,如果需要两周时间才能计算出明天某个航班的满座率,那还有什么意义?大数据计算技术,适用的不是像卫星发射、开具银行账户这样的工作,而是不要求极端精确的情况,其核心是“预测趋势”,况且原始数据也可能出现差错。
过往千年,探究因果关系几乎是所有科学研究的原动力。甚至,这已经通过语言,融入我们的思维方式和哲学思想:“因为……所以……”,凡事都要问“为什么”。但是,在大数据的范畴里,关注的却是相关性,而不是因果关系,或者其次才是因果关系。超市只用关心把啤酒和尿不湿放在一起,会帮助提高销售额,而不用关心其中的奥秘。如果说原因,可能很多都是人们的习惯、方便,甚至是人性,例如奶爸们习惯买尿不湿的时候给自己捎上几罐啤酒。
在此,也有一些自己的思考:如果说搜索引擎所解决的问题表面上是帮助用户找到需要的信息,而实质是帮助企业找到拥有某项需求的客户,深层次讲是解决了《第三次浪潮》中提出的消费者和生产者分离的根本矛盾,如果再加上3D打印技术,就可以完成由消费者主导的“个性化”生产过程;而大数据所解决的是,通过对所有用户的数据进行分析,可以预测用户群整体的需求变化趋势,从而完成批量产品生产、销售的调整问题,其奇妙之处就在于无需用户“开口”说出她想要什么?一个解决的“个体需求”,一个解决的是“群体需求”。
本书除了提出上述三项基本观点,其它的内容大多是举例说明,多少有些空泛。但是,其实大数据时代才刚刚开始,对大数据的应用也只是停留在比较浅的层面上,作者能提出这三项基本观点已属难能可贵!