数据杂想——数据不是万能的

数据杂想——数据不是万能的

一切大数据时代的畅想让我们觉得:通过数据,我们可以总结规律,挖掘价值,甚至为业务指明方向,我们可以为公司的老板、决策者、执行者所用,我们是他们非常重要的部分甚至是最重要的部分。但一切美好的畅想过后,我们发现数据不是万能的。一切认为数据是万能的想法和认为数据什么也不能的想法同样的无知。

问题一:我们所接触的数据是与公司的核心业务指标关联性太小

很多时候我们的数据分析师都在围绕着自己的数据打转,但很少有人会想到自己的数据离公司的核心有多远?比如做网站分析,网站分析对公司有多重要?你可能会说:营销分析、用户体验分析都是网站分析的支持对象啊。没错,如果你的公司是营销公司,那么网站分析几乎是网站前端运营的全部(注意,是前端运营,也就是业务部分,不包含公司职能部分);如果你的公司是电子商务公司,那么网站分析有多重要?它离电子商务的核心——盈利或者销售收入有多远?如果网站分析不能与公司核心业务挂钩,网站分析的最终价值有多大?可能仅仅是服务于一个部门或者几个部门,可能他们永远都不知道老板的所关心的收入和利润。

问题二:我们永远不知道数据到达你手上之前都发生了什么

在你接触到数据之前,数据最起码经过数据采集、数据存储、数据提取三个部分,很多大型公司的数据存储会分为主生产环境数据,从库或附属库数据,甚至还会经过各种加工到达其他存储库;数据的提取上,不同的人对数据的采集和存储规则的理解不同,提取出的数据结果自然不一样,同一个需求,两个人提取的结果很可能不一样。面临这样的情况(或许这些数据分析师都不曾想过),作为数据分析师们探究出来的结果,可信度有多高?

问题三:数据的科学性和业务要求的紧迫性永远都有冲突

通常我们在做数据结论之前都会要求一定的数据样本量,但大多数情况下,业务的时间性需求比较急。比较UED做页面产品功能体验,假设业务的操作规则是每月一次改版,那么在网站流量不大的情况下,你的数据样本量或数据严谨性的问题与业务时间性要求问题如何协调?再举个常见的例子,站外广告投放通常只会购买几天的排期,尤其是某些特定广告资源更会在特定时间上线。业务操作上的时间较短,数据如何在业务实践中发挥价值但又不是严谨性?

问题四:数据通常只反映结果,但无法告知其中原因

现阶段大多数情况下的数据都属于事后分析,那么就事后分析来看,我们知道了结果,原因何在?会不会在分析一圈之后出现一个滑稽的转折点?比如我常说的一个例子,我们在做客户妥投率分析时,经过很多调研和分析,但最终物流经理的一句话解开了谜底——那天我们的A送货员请假了,所以货没送出去。

问题五:数据是有立场,决定了解读方向

当你在某个中心甚至部门下面做全公司的数据分析时,面对数据结果你会如何分析和解读?是首先自然而言的具有保护意识——这不是我们的问题,还是先客观的做全面评估?我们永远不知道数据解读的出发点,唯一知道的是数据分析师的立场决定解读。如果一个分析师具有某种导向的见解(不一定是偏见),那么这种见解一定会出现在他的解读结果中。很难想象这样的解读是对还是错,甚至是否是灾难性的解决。

本文为专栏文章,来自:宋天龙,内容观点不代表本站立场,如若转载请联系专栏作者,本文链接:https://www.afenxi.com/14578.html 。

(0)
上一篇 2015-04-14 16:40
下一篇 2015-05-15 16:07

相关文章

关注我们
关注我们
分享本页
返回顶部