摘要:五大数据模型,是笔者认为运营商进一步提升自身数据价值要去努力的方向,它是基于运营商特有数据,综合采用爬虫、社交网络、搜索、推荐、自然语言处理等技术才能打造出来的,正如互联网公司花了很大代价去做ID-MAPPIN1NG一样,这些都是核心能力,需要运营商以工匠的精神去倾力打造。

运营商的大数据有价值毋容置疑,笔者在《PK BAT大数据?谈谈运营商大数据的价值》一文中有详细的阐述,但当前面对的挑战不少。

“为什么公司拥有这么多大数据,好像对于内部经营的改善还不多!”

“对外价值变现的收入还不怎么够看,什么原因呢?”

“建立了大数据平台,采集了很多数据,投资什么时候回本呢?”

当然可以有很多的理由,诸如组织、机制、流程、人才等等原因,老生常谈了,特别是安全像达摩克利斯剑一样悬在胸前。

但除了外部客观因素,也需要思考一下,是否也有内生的原因?当前的运营商新增大数据的质量真的经受得住市场的检验吗?

在运营商内部经营中,似乎账单、用户、订购、话单老的小数据仍然是分析的主要数据,也是营销的主要依赖数据,诸如位置、上网、社交、信令等很多大数据似乎“名不符实”, 实际用的还比较少,什么原因呢?

当然有推广培训的因素,但笔者还认为有更重要的原因,即这些大数据的“原生价值”有限,只有经过加工,比如建模,才能让这些数据发挥出真正的价值。

举个例子,说运营商的上网数据有价值,那运营商上网的原始记录是怎样的呢?这里以http为例:

为变现赋能 ,运营商大数据建模的五个方向-数据分析网

这个冰冷的URL对于网络性能分析可能有价值,比如可以统计京东APP的流量啥的, 但与结构化的ARPU、MOU等能直接用于营销的小数据相比,业务人员似乎没有什么手段去获得这个URL承载的信息或知识。

高喊着运营商DPI数据有价值没有意义,谈DPI被HTTPS也有点杞人忧天,运营商需要用工匠的精神去挖掘出这些数据的潜力,这些数据就如浮在海面上的冰山,你只看到了10%,90%都沉在下面,然后束手无策:

为变现赋能 ,运营商大数据建模的五个方向-数据分析网

互联网公司跟运营商也是有合作的,他们对于DPI数据是非常看重的,马上能拿去变现,差距在哪里呢? 当然有渠道的因素,但不仅于此。

很大的差距就在于数据加工能力,一般有两个层面的含义,解析和建模,解析是把原生的数据加工成可以使用的结构化业务信息,建模是基于这个信息再去挖掘出知识,以下统一称为建模能力。

笔者总结了运营商大数据需要具备的五个核心建模能力,社交网络、序列模式、空间建模、内容挖掘及在线推荐,这对于运营商未来的内外规模化变现至关重要。

为变现赋能 ,运营商大数据建模的五个方向-数据分析网

当前运营商最大的变现应用,逃不过用户信息的验真及基于位置的客流、旅游、公安等等,这些都还是浅层次的应用。

客户的应用一旦深入,很多运营商大数据应用的底层数据的质量恐怕会面临挑战,现在有不少的应用场景由于数据的原因而无法推进,比如上海迪士尼乐园关于位置数据精度的要求,虽然商业前景极其广阔,但其对于数据的要求却是及其严苛的,这个在未来激烈的市场竞争中会成为常态,现在能赚钱的并不代表客户一直愿意为你买单,笔者常常想,换成我是客户,我会为这些产品买单吗,运营商产品给我到底带来了什么价值?

想到了炒股总有亏有赚的,最终的赢家似乎还是价值投资者,不求一时但求长远,运营商也许需要一步一个脚印,用厚重来打造出自己的大数据优势,以下五个建模能力也许能支撑起运营商大数据的未来。

1、社交网络

运营商以前的营销都是基于个人的营销,随着家庭市场、政企市场、簇群市场的崛起,运营商未来必将以群体营销为一个核心,今天跟杭分的一个同事交流,给了我一个启示,未来所有的流量营销可能都要以家庭为单位,你必须知道每个人的家庭关系,才能对于家庭成员进行精细的分析,才能得到新的群体营销机会。

政企也许也这样,你必须找到集团的关键人物,才能进行一次营销,客户经理纵有通天的本领,你也不知道新的集团什么时候产生,什么时候有新的营销机会,你总是滞后的,也许,社交网络可以帮到他。

业界用的很成熟的PageRank,运营商似乎也没怎么用,仍然用交往圈大小来粗犷的判断一个用户的影响力, 关系和影响力也未在运营商的营销中占据一个位置,能否改变一下用通信arpu判断用户价值的方式?

为变现赋能 ,运营商大数据建模的五个方向-数据分析网

在对外变现中,客户已经有家庭,朋友,同事方面的标签要求了,未来这类需求将会越来越多。

簇群营销一定会茁壮成长,换终端,用户更愿意相信身边朋友的推荐和建议,看视频,我其实更关注朋友们在追踪啥,这些,对于运营商都是机会,因为维系着一张最硬的社交网络,这张网络的价值不仅仅是以前的通信价值,未来的社交价值将越来越大。

2、序列模式

运营商传统营销中基于ARPU、流量等进行规则限制的营销都属于静态营销,丢失了大量有价值的时间信息,比如月末流量饱和度高和月初流量饱和度高反映了不同的需求,但营销中可能仍然一视同仁,因为寻找频繁序列需要一定的建模技能。

为变现赋能 ,运营商大数据建模的五个方向-数据分析网

中国移动的天盾反欺诈系统正是通过信令的时间序列建模精准的进行了欺诈的识别和拦截,天盾只是一个简单的案例,运营商还有位置序列、通话序列、上网序列、短信序列以及这些序列的组合,基于这些序列运营商可以挖掘到更有价值的信息,比如曾经在某个地市的位置序列中发现固定的人群的迁移规律,序列代表了一种生活规律,也许,商机就蕴藏在这些序列中,有待于运营商去挖掘。

3、空间建模

运营商当前80%的商业变现估计是基于位置数据创造的吧,但运营商的空间能力可远不止于此。

为变现赋能 ,运营商大数据建模的五个方向-数据分析网

随着运营商变现的深入,商业驱动着运营商会去做位置精度的持续提升,从基于基站的几百米到MR的几十米再到几米,当前浙江移动的位置精度已经到了商场级别了,位置精度的提升也带来了产品能力的提升,如下图所示:

为变现赋能 ,运营商大数据建模的五个方向-数据分析网

位置是理解客户的一把钥匙,新零售创新的一个抓手,运营商最为宝贵的数据财富,将随着精度的提升创造无限的应用场景。

为变现赋能 ,运营商大数据建模的五个方向-数据分析网

4、内容挖掘

运营商的原生DPI价值不大,但通过网址解析、爬虫和文本挖掘,就可以让DPI数据产生巨大的价值,这是毋容置疑的,以下图一是爬虫逻辑,图二是爬取的示意,图三是获得的知识库示意。

为变现赋能 ,运营商大数据建模的五个方向-数据分析网
为变现赋能 ,运营商大数据建模的五个方向-数据分析网
为变现赋能 ,运营商大数据建模的五个方向-数据分析网

从DPI中的URL可以获得有效的爬虫网址,通过爬虫获得知识库信息,这将能真实的反应是否是用户点击了某部电影,某首歌曲,某本书等等, URL的解析能力和知识库的规模决定了运营商DPI数据的价值。

如果获得的是文本信息,可以采取文本挖掘技术,比如信息抽取,文本摘要、文本聚类和文本分类等,从而构建出用户的内容偏好,以下是一个示例:

为变现赋能 ,运营商大数据建模的五个方向-数据分析网

从数据的角度看,运营商管道是不是哑了不是由互联网说了算,而是由运营商的建模能力决定,诸如电商https影响很大,但这个世界很大,并不是仅仅只有电商,互联网的长尾效应还是很长的。

但内容挖掘涉及的技术很多,爬虫系统得靠自己建,知识库建立需要较大的人力投入和维护成本,自然语言处理+搜索也不是那么容易搞定,对于运营商挑战实在有点大,但运营商一定要坚持做这个,从管道中逼真的还原用户的行为,这个才是未来。

为变现赋能 ,运营商大数据建模的五个方向-数据分析网

5、在线推荐

随着新零售口号的响起,线上线下融合也将在运营商刮起旋风,运营商强大的线下能力逐步要为线上引流了,线上的大数据最大价值就是推荐吧,智能推荐技术将是运营商必须掌握的建模技术。

这个领域门槛不是很高,但起步也并不容易,浙江移动的咪咕爱看是个视频APP,推荐大家下载使用,经常有流量优惠和赠送,性价比很高哦,近期上线的猜你喜欢栏目采用的推荐引擎是如下四个模型的综合:

为变现赋能 ,运营商大数据建模的五个方向-数据分析网

习惯了线下目标用户群用经验规则取数的业务人员,从线下转到线上,除了营销渠道发生了变化,推荐方式也有了巨大改变,要相信智能推荐技术会比人工经验好,这是为互联网公司证明了的,只要迭代次数够多,模型就能实现千人千面,这一点,要向互联网公司学习,人工选择的热门推荐当然也不错,但机器学习推荐是有长尾效应的,比如亚马逊假如总是向我推荐最热门的书籍就没啥意义了。

五大数据模型,是笔者认为运营商进一步提升自身数据价值要去努力的方向,它是基于运营商特有数据,综合采用爬虫、社交网络、搜索、推荐、自然语言处理等技术才能打造出来的,正如互联网公司花了很大代价去做ID-MAPPIN1NG一样,这些都是核心能力,需要运营商以工匠的精神去倾力打造。