被“过度解读”的大数据
据美国媒体报道,在“大数据时代”,我们生活中的一切似乎都可以通过量化的方式来进行解释,但在逐渐熟悉这个名词的同时,我们也必须要警惕“过度解读”大数据对企业可能造成的危害。
在电影《派特的幸福剧本》中,罗伯特德尼罗饰演的角色就给我们在这方面进行了一番生动的“诠释”。这个名叫老派特索利塔诺的角色,是费城老鹰橄榄球队的忠实粉丝。他坚信,许多毫无联系、随机发生的事情,例如遥控器摆放的位置等,都有可能会成为决定球队比赛胜负的关键因素。
大多数人都会认为,德尼罗演的这个角色只不过是个迷信的家伙罢了。但事实上,他的这种做法在另外一部分人的眼中,正是对事物过分诠释、牵强附会以至于滥用的表现,一种将互相之间毫无关系的随机事件进行“解读”,希望找出他们之间的联系,并从中找出“模式”的做法。而喜欢解读看似毫无意义的东西,正是人脑本身固有的特点,相信不少人也都有过这种体验,受到潜意识的影响,我们总是认为某一朵云彩的形状很像人脸,总是觉得某段音乐的背后隐含着信息。
然而,研究人员认为,这种“过度解读”的行为,很有可能会给企业带来危害。
“大数据的出现,让一些研究人员认为,自己可以通过一定量的数据,来分析出任何东西。”微软研究院首席研究员Danah Boyd、新南威尔士州大学副教授Kate Crawford在他们合作发表的文章中这样写道,“因为数据积累量的庞大,原本毫无干系的事情之间也可能会存在联系,这种情况诱发了对大数据‘过度解读’的倾向。”
而企业受到这种倾向的影响,就会去利用大数据分析,得出一些其实并不准确的结论,这一分析过程本身不但耗费成本,所得的结论还会影响企业从广告到管理的诸多决策环节。
在这方面,一个典型的例子就是谷歌公司。谷歌公司2008年开发了“流感趋势”,这个工具是通过分析人们借助谷歌对流感、感染症状、诊断等方面词汇的搜索,来判断流感人群所在的地理位置,从而得出流感爆发后的实时传播地图。这个工具在一段时间内的表现还是不错的,但在2012年12月却出了岔子。《自然》杂志发表的一篇文章显示,谷歌提供的流感病患统计数,足足是疾病防控中心统计数据的两倍。这是为什么呢研究人员认为,由于媒体对流感爆发进行了“铺天盖地”的报道,人们对流感相关内容的搜索量大大增加,这就使得谷歌的数据过分地“膨胀”了。如果一家药房利用谷歌的数据来决定对流感防控药物的存货量,很有可能就会导致储存过度。
“越来越多的商业品牌开始依靠数据来管理自己与客户之间的关系,并推动自己的业务发展。在这种情况下,如果盲目地依靠数据做出决策,并执行这种决策的话,坦率的说,确实非常令人后怕。”英国市场调研机构GfK NOP总经理Colin Strong表示,“如果企业不停下来想一想这些决策究竟是怎么做出来的,就很有可能会承受商业上的损失。”
“对大数据的使用,仍然是主观的,量化得出的结果,有时并不代表客观事实。这一点,在社交网络的信息方面表现得尤为明显。”Danah Boyd与Kate Crawford表示。
据悉,虽然目前人们逐渐开始萌生了谨慎地使用大数据的意识,但对于具备合理使用大数据技能人才的缺乏,却有可能会使“过度解读”大数据的情况愈演愈烈。
根据麦肯锡研究院2011年发布的报告,到2018年,全美范围内对具备量化分析等分析技能的“大数据”相关人才的需求,将会达到400万之巨。此外,在大数据相关的管理与分析人员方面,还有可能出现150万的用工缺口
“目前,客户最经常向我们抱怨的,就是找不到合适的应聘者。”一家负责数据类相关职业招聘的机构负责人告诉记者。
根据这家机构开展的调查,数据分析行业的从业人员中,89%的人基本上每月都会通过LinkedIn等网站拿到新的邀约,25%的人被其他企业联系的频率更是高达每周一次。而这位负责人更是预测称,随着纳米技术的发展,预计到未来,相关职位的需求将会出现“井喷”。