1. 数据分析网首页
  2. 大数据
  3. 数据分析

从马尔可夫矩阵看垄断企业的马太效应

近来最受关注的新闻之一莫过于滴滴和优步中国的合并了。

近来最受关注的新闻之一莫过于滴滴和优步中国的合并了。根据相关资料来看,滴滴换股收购优步中国后,新的滴滴出行将占据中国专车市场份额的93.1%,关于垄断的争议已经在各大媒体上发酵。垄断,这个从古至今的现象,究竟是怎么产生的呢?本期我们用马尔可夫矩阵展示一下垄断企业产生的必然趋势。

周末聚会之后,我与朋友叫了一辆优步拼车回家,因为比不拼车便宜六块钱,虽然这意味着要绕路接人,二十分钟的路也许要走四十分钟。优步APP显示,司机会先来接我们,然后从一个崎岖的地方接一位“丽”。

车来了,我们两个坐在后排,然而路上出了点差错:快到接人地点时,“丽”的手机忽然打不通了。不是占线、也不是没人接,而是长达十分钟内完全打不通。我们停在路边,三个人都在低头玩手机。

“等还是不等?”司机问道。

“听您的。”

最终司机决定放弃这位失踪的拼车客,我们又花了十分钟从这条街里拐到原路上。显然,此时司机已经非常烦躁:他没能赚到那份拼车费,又浪费了将近半小时,于是决定对我们倒倒苦水。像世界上每一个男性一样,他先从大事说起,比如优步被滴滴收购。

曾经既没有滴滴、也没有优步的时候,网约车还被叫做黑车,那时我很喜欢跟黑车司机聊天,因为司机往往认为我似乎能理解他们不愉快的生活,然后给我抹去车费的零头。奇怪的是网约车司机从来不会这么做。不管怎么说,这次的优步司机讲道:据说滴滴马上就会取消给司机的全部奖励,而且最近他接到的单子越来越少,“我都不想干了”。

“因为滴滴形成垄断了,”他说,“我们不管怎么选也只能加入他们家。你们也一样,以后车费肯定涨起来,不像以前那么便宜了。”

近些年来,关于“垄断”的新闻层出不穷,似乎每个行业巨头企业都曾惹上相关的官司。以IT领域来说,1969年,IBM曾深陷其中;2001年,微软被指控垄断;不久前,欧盟也起诉Google垄断。根据相关资料来看,滴滴换股收购优步中国后,新的滴滴出行将占据中国专车市场份额的93.1%,这个数字确实听起来很危险。

垄断是个从古至今的概念,垄断企业的产生通常由于两种情况,一种是凭借技术上的优势、形成行业上的垄断,如社交领域的微信、出行领域的滴滴、网购领域的淘宝,都是凭借一定的技术优势成为某一细分领域的垄断巨头。另一种则是由国家控制下的垄断行业,比如烟草、电力、铁路等行业,一直由国营垄断,规定私人不可经营。

先不讨论第二种情况,但我们也知道,无论某企业在技术上有多大优势,对市场份额的吞并仍不是一夜之间可以完成的,何况其竞争对手们自然也在进步。为什么最终企业A吞并了企业B,而不是相反呢?因为A太高明、B不努力?因为A顺应了时代潮流、B没有抓住机遇?答案也许是其中一个,也许都不是。也许马太效应是一个答案。

“马太效应”典出《马太福音》:凡有的,还要加给他,叫他有余;凡没有的,连他所有的也要夺去。而这一理论最早由美国科学史作者罗伯特·莫顿提出,他认为,相对于那些不知名的研究者,声名显赫的科学家通常得到更多的声望,即使两者有着相似的成就。在科学界,马太效应的确可以解释许多不公平的现象:某项重要成就的研究中,常常有些做出了重要贡献的科学家由于国籍、性别等原因,被人忽视甚至遗忘了。不过,“马太效应”最为显著的领域还是当属经济学:富者愈富,穷者愈穷。

垄断企业和马太效应就是天生一对,垄断企业肯定存在马太效应,马太效应则必然带来垄断企业。我们不妨用模拟数据来证实一下。

一个行业体系中,企业的市场份额波动可以用一个特殊的随机过程来模拟,这就是马尔可夫链。马尔科夫链是一种无记忆系统随机演变的数学模型,这意味着系统未来的行为仅依赖于系统当前的状态,而不考虑其他方面的影响因素。

马尔可夫链有两个特征,一个是稳定性,另一个是马尔可夫性,也称为无记忆性。在一个初步成型的行业体系中,如果没有重大的改革,我们就可以认为企业市场份额的波动过程满足稳定性的要求。由于现在产品和服务的可选择空间越来越大,客户基本只会根据各个企业最新的服务水平来做出选择,而不会借鉴很久以前的服务水平;因此,我们认为,企业市场份额的波动过程满足稳定性的要求是完全成立的。

首先令W (t ) 表示在时刻t 的市场份额状态,P 表示市场份额的转移概率矩阵。我们可以推导出在时刻t+1 的市场份额为

W (t+1)=W (t P

假定一个行业内有5个主要的企业,第t年的市场份额向量为W (t )=(W1(t),W2(t),W3(t),W4(t),W5(t))×P,其中W1(t),W2(t),W3(t),W4(t),W5(t)分别为第t年中每个企业的市场份额。转移概率矩阵P的元素pij表示市场份额从第i个企业流向第j个企业的概率。

为了找到转移的趋势,我们需要用二次规划来估计矩阵P,该矩阵解释了这五个企业之间的关系。在设定目标函数时,我们希望市场份额的实际值越接近于预测值越好,即估计出pij的值可以使得总的误差达到最小。除了目标函数,还必须考虑约束函数:每一个转移概率都必须在0 到1 之间,每一行上所有的元素之和必须等于1。这样,我们就得到了以下的限制条件:

从马尔可夫矩阵看垄断企业的马太效应

下表中展示了该行业中五个企业的主营业务收入:

从马尔可夫矩阵看垄断企业的马太效应

显然,我们可以根据2015年第一季度的营业情况将该行业中的企业分为三等:第一等级是企业C,它的主营业务收入远远超过其他企业的;第二等级包含了企业A,B 和D,其中B 和D 的收入之和都要小于企业C。第三等级包含了企业E,它的份额太小,几乎很难影响其他企业。在这个行业中,最大和最小的企业之间有很大的差距。

那么,这五家企业的后续发展如何呢?从上表的数据中,我们可以看出,只有最大的企业C保持了迅速的主营业务收入增长。或许用市场份额来看会更加明显:

从马尔可夫矩阵看垄断企业的马太效应

企业C的市场份额在一开始就是最高的,而后来又几乎保持了连续的增长:从2015 年第一季度到2017 年第一季度,它的市场份额足足增加了6个百分点,从39.18%增长到45.11%。与此同时,第二等级中三家企业的市场份额几乎一直在减少,减少的总量大约等于企业C的增长量。最小的企业E 的市场份额非常小,只是在其他企业的竞争中得到一点喘息之机。

下图代表五家企业的营业收入走势,不用说,只有C一直有增长的趋势。

从马尔可夫矩阵看垄断企业的马太效应

利用市场份额的历史数据,我们在SAS OR 中估计出了转移概率矩阵。结果如下:

从马尔可夫矩阵看垄断企业的马太效应

现在让我们观察矩阵P的对角线元素,它们表现了保持市场份额的能力:这个能力值越接近于1,说明保持市场份额的能力越强,反之说明保持的能力越弱。毫无悬念的是,企业C的保持能力最强,企业A的能力次之,企业B和D的能力并列第三,而企业E几乎没有保持市场份额的能力,——这种顺序几乎和市场份额的大小完全一致。或许,在不久的将来,企业C即将成为该行业中的滴滴。不用说,该行业中存在着显著的马太效应。

需要注意的是,利用马尔可夫链进行的模拟过程只考虑当前状态,即各个企业当前的市场份额,而其他可能的影响因素都不在我们的考虑范围之内:这就是说,我们不会假定企业C比其他企业经营得更高明、技术发展更快等,企业C在系统中唯一的优势,就是超出其他企业的市场份额。因此,在一个行业体系中,如果没有重大的政策导向或技术突破,大企业会由于先发优势一直保持这样的增长势头,直到成为垄断寡头。在马太效应的作用下,垄断是一种趋势,甚至是一种必然。

除了垄断企业本身,恐怕没有人会觉得垄断是一种好事,司机和我们都会因为滴滴的垄断遭到若干损失:他少一些收入,我要多付一些车费;他会跟接下来的每一位乘客抱怨这种悲观的可能,而我会把这件事写在文章里。甚至,司机与我之间也存在着一种不可避免的马太效应,——他当前拥有的资产比我多,因此他可以买辆车,然后从我的资产中赚取车费;当然,指出这一点应该并不会让他感到多么安慰。

当我们看到一种现象、一个结果时,常常会刻意从中寻找一些原因。我们可能会理所当然地认为,行业中的垄断者具有其他企业所没有的品质,比如经营得当、决策超前、老板特别有魅力……然而,如果以数据分析的视角看待问题,就可能会发现,所谓原因也许根本不存在、或者并没有发挥那么大的作用,我们不过是被一种趋势(或称“历史的车轮”)携裹着前进。这样的视角可能会让你悲观,但也可能会让你更坦然、更有准备。

因此,很多时候,数据工作者所做的事情,就是一直在观察数据、调和模型,静静地等待着“趋势”的出现,并且提醒你:不要被抛在后面。

本文为专栏文章,来自:KPMG大数据挖掘,内容观点不代表本站立场,如若转载请联系专栏作者,本文链接:https://www.afenxi.com/22919.html 。

联系我们

如有建议:>>给我留言

QR code