1. 数据分析网首页
  2. 大数据

以偏概全?你真的了解客户画像吗?

企业通过大数据建立客户画像,以此找到客户需求,进行精准营销。然而,许多人认为线上数据不具有代表性,无法代表线下市场,真的是这样吗?

摘要:企业通过大数据建立客户画像,以此找到客户需求,进行精准营销。然而,许多人认为线上数据不具有代表性,无法代表线下市场,真的是这样吗?

前几日,笔者在跟一个知名公司的IT部门负责人交流大数据方案的时候,对方说了这么一件事。他们试图对他们几千万的客户做一个客户画像,大致就是希望知道客户中,男女比例、年龄分布、职业分布、薪资水平、兴趣爱好、分布地区等等要素信息。然而问题在于,通过各种渠道得来的信息不完全,几千万客户中,明确性别的有400多万,明确年龄的有100多万,明确职业的只有几十万,列明薪资水平的只有几万人。而且数据质量并不高,有很多人明显是乱写的。于是他们得出的结论就是这些数据没有什么价值,需要另找渠道收集信息。

谈到这里,笔者竟无言以对,因为我实在不知道是否要重新讲下统计学的知识。

无独有偶,笔者最近看到一则新闻,大意是说,有一个调研机构在一个几百万人的城市里采集了400个样本(人),得出一个结论,结果媒体和老百姓一致谴责调研机构敷衍了事,不负责任。

有时候笔者甚至怀疑,是不是大数据害了统计学呢?

统计学上有关于置信度和样本量的阐述,仔细探究的话还有一张对照表(文章内就不列了,有兴趣的可以去百度)。

400的样本量大致对着的是95%的置信度和5%的误差率。而且总体的量越大,这个数据越可信。只要你400的样本量是随机的。

然而在大数据的概念充斥这商业环境的情况下,我们这些上过大学的人,恐怕早已忘记我们是学过统计学的人。

回到一开始客户的问题,在几千万的客户中,如果我们想知道男女比例,这是一个非此即彼的问题,只要有400个随机的真实的样本,就可以达到很高的95%准确度了。即便想达到99%的准确度,1%的误差,也不过需要20000人的随机样本。如果没有这一理论基础,那么让那些传统的市场调研公司怎么存活呢?

以此类推,如果市场部人员想要了解客户的分布,只要在总体数据中选到10000个质量高的随机样本,基本就可以对自己的市场群体有个大致准确的了解了。

然而,笔者并不想讨论这些静态的客户的画像,笔者更加关注的是客户动态的行为数据。在《增长黑客》这本书中,其作者一直在强调一个观点,就是在高速的用户增长下,数据分析很重要,在作者列出的近十个查看数据的工具(比如google analytics),没有一个是看客户的年龄、性别、职业这些的,我们更加要关注的其实是客户的行为数据,而正是因为对客户浏览页面、点击按钮的频次的数据分析,增长黑客们才知道,在互联网产品中有用和无用的功能,才能对产品进行优化和迭代。

了解客户的性别、年龄、职业、有必要吗?

在大多数人的想象中,似乎我知道了客户的基本信息,我就可以做到精准的广告推送,产品开发也有的放矢了。但实际上,在当前的数据环境下,对客户的研究和精准营销早已经超越了这一传统的看法。现在的基本逻辑是,通过对客户高频次、多维度的行为数据,预测客户可能的购买习惯甚至预测会购买什么产品。这里面用的数据技术不再是单一的数据统计和逻辑推理。决策树、聚类甚至神经网络的算法都会被用到,以做出更加精确的预测。

结合笔者这几年从事大数据相关工作的经验,遇到最多的问题就是,客户会说,我大部分的业务在线下,线上数据不具有代表性。果真如此吗?

且不说,线上市场能占到整体市场的多少比例,即便是我们从新兴消费者的特性出发,每一个企业主也不得不正视,线上市场一定是未来的主阵地。

从笔者近几年从事大数据业务以来的观察来看,家电、服装、婴童用品、化妆品等品牌竞争激烈的行业对数据一直以来都高度重视。而由于产品特性的不同,家电行业更加重视利用数据辅助产品开发、市场推广。这些企业的市场人员,对线上数据的重视程度甚至高于线下,不仅是因为线下数据采集的准确度差,更是因为,家电线上市场的销售占比呈显著走高的趋势。而对于服装这种差异化强,购买频次高的产品,商家最注重的是客户画像和精准营销。笔者在满足客户这一需求的时候,就考虑到线上数据维度不足(并非样本不够)的问题,于是就采用了在线下门店部署数据采集设备的方法来获取用户的行为数据,最终以线下数据和线上数据结合的方式进行数据分析,来获得更加准确的客户分析结果。

很多企业市场人员尤其是销售人员,在利用数据的时候往往容易陷入到追究细节的准确性上,却忽视了数据分析的初衷——发现趋势以作出决策。线上市场尽管只代表了企业一部分的消费者,但不可忽视的是这部分消费者的数量其实并不小,而且他的群体数量还在不断扩大。据统计,中国目前有7亿互联网消费者,占到总人口的50%。对这部分线上人群的消费数据所做出的趋势判断,其实完全可以作为对整个社会消费趋势的判断。因为他们满足三个条件,第一,具有样本随机性;第二,样本量足够大;第三,这部分消费群体是未来的消费主力。

可以说,没有第二种方法能代替线上数据来做出更加准确的分析和预测。以追灿数据的“决策狗”平台(http://ax.zhuican.net/)为例,它主要是通过对行业以及企业内部的数据分析,帮助企业解决营销领域的诸多决策性问题。在大数据的底层架构,平台已涵盖大量行业的线上数据,包括5000个产品品类,横跨10个大型互联网平台,3200万件商品的长达2年销售数据,3.5亿条交易行为数据,以及消费者在互联网媒体留下的3亿次文本数据,并可以快速集成企业内部各种异构系统的数据,在数据仓库中进行业务模型的构建。从这个角度上说,通过如此巨大的线上数据做出的消费预测,绝对比一个老牌的线下市场调研公司得来的结果要准确的多。

杰克·特劳特在《定位》系列中一直强调,企业要将产品定位到客户的心智中,笔者也相信,未来的产品将会在产品定位品牌调性上越来越细分,深入到客户心智上也越来越细致。这就预示着,未来的产品,无论是线上还是线下,客户再无多少差别,当市场已经融合的时候,我们还会关注分析的样本是来自于哪里吗?

本文由 追灿数据 投稿至数据分析网,并经数据分析网编辑。版权归作者所有,转载此文请与作者联系。

本文由 追灿数据 投稿至 数据分析网 并经编辑发表,内容观点不代表本站立场,如转载请联系原作者,本文链接:https://www.afenxi.com/32413.html 。

分享本页
返回顶部