企业公告

在网球中看懂大数据分析

IBM中国公司对外关系部 孟岩: 第4拍到第9拍的胜率,接对方一发的回球得分率,这些都不是随便能在电视直播的屏幕上找到的指标。而谁又能想到,这些不起眼的指标才是衡量战局、决定成败的关键点呢?

谈到“大数据”,最令人不可思议的事情就是有那么多人都傻呵呵的乐观。是的,“大数据”这个词火了一年多,“数据中藏着财富”的观念也开始被人接受,但是实际情况是,大部分企业、组织和个人,不要说大数据,连自己手上那点小数据都只是刚刚能勉强应付。应付而已,对于其中埋藏的知识和价值不要说发掘,恐怕都没有意识到。在这样的情况下,如果以几何级数增长的数据海啸排山倒海而来,而且其中混杂着大量的模糊数据、非确定性数据和非结构化数据,一个头脑清醒的人首先应该感到的是敬畏,而不是乐观。

所以IBM从来都是把“大数据”跟“分析”放在一起讲的。“大数据”加上“分析”,才有可能得到价值,才有意义。没有“分析”的“大数据”,就是一场淹没一切的数据海啸,是灾难。“分析”才是关键能力,才是点石成金棒,才是降魔杵。

不过人们只谈“大数据”而不谈“分析”也是有道理的。“大数据”这个词在传播上有优势啊!什么词最容易流行?既是新词,又望文知义,既朗朗上口,又能装深刻的词。“大数据”和“物联网”这两个词就有这些特点,所以轻而易举地流行起来。而“分析”则是一个平淡无奇的词,不具备可流行性。我曾经在一个专业的大数据研讨会里听到一位业内极有影响力的前辈人物说,“大数据分析”中的“分析”不是什么新鲜玩意,想当初他的队伍刚开张,坐在部委下属的信息情报所里整天干的就是这个玩意。

这是一个悲剧。因为“分析”不仅是整个游戏的关键,而且它的本意也比字面意义要深刻和有趣的多。它所对应的英文原文是 analytics,而不是 analysis。用于数据分析的时候,这两个词的意思存在细微而意义重大的差别。Analysis是统计、过滤和抽取,基于现有的知识,在数据中找到关键的、有价值的信息。而analytics更进一步,是通过数据的比对和相关性发现,发现新的知识。拿一个老掉牙的例子来说,超市通过analysis 可以知道哪个品牌的啤酒更受本地顾客的欢迎,平均每个周三会销售多少棵大白菜,但是只有通过 analytics 才能知道把啤酒和尿布放在一起能够增加销量。假如第一个翻译 analytics 的人能够更谨慎一点,换一个译法,或许会更有利于大数据的应用真正落地,也不会让那位前辈自以为自己当年做的 analysis 就是今天所说的 analytics。

您已阅读33%(953字),剩余67%(1912字)包含更多重要信息,订阅以继续探索完整内容,并享受更多专属服务。
版权声明:本文版权归FT中文网所有,未经允许任何单位或个人不得转载,复制或以任何其他方式使用本文全部或部分,侵权必究。
设置字号×
最小
较小
默认
较大
最大
分享×