摘要:在大数据的光晕下,“小数据”其实也有它的魅力。毕竟我国的数据体系不像欧美等国家那么开放,很多个人数据短期内难以获取,更多的是集中在大型运营商和互联网等企业中。

【导读】不要忽略中宏观数据,其具有窥探政策走向和市场机会的重要价值。

文/老黄 原力大数据产品部总监

在“大数据”群雄逐鹿、行业间数据壁垒森严的当下,整合和运用这些大数据在有些行业和场景,几乎是不可能的事情,或者需要耗费巨量的资源和成本,却达不到预期效果。那么,真正的“大数据”时代尚未到来,我们是否可以运用一些中宏观的“小数据”来解决实际问题呢?

中宏观数据的价值 

中宏观数据的价值在于,它的变化决定大盘的长期趋势走向。这些数据主要来源于国家和各权威政府机构的门户网站,这些公开数据虽“措手可得”却不容小觑,善加分析利用,通过深入横向和纵向对比数值,可以窥知政府政策走向和区域市场机会,有着极其重要的作用。

解读中宏观数据,需要极强的业务能力 

政府公开的中宏观数据看似“措手可得”,却要求数据分析师具备深厚的行业背景知识、极强的业务理解能力,才能正确解读其中的奥妙:

难点一:数据源和格式繁杂是公开数据的特征之一,要弄清楚数据源的路径,以及每个字段的可获取性和获取手段都要花一定的时间;

难点二:各个部门(如国家统计局和教育部对于某些数据指标)的统计口径不一致,有时即便是同一个部门不同数据指标也会有所变动,这要求分析师除了要对行业知识有深入了解之外,还需对数据高度敏感,也就是说有通过行业现状反推数据合理性的能力,即如何把公开的数据转化成可靠的数据,而不是原封不动的抄下来就完事了。

原力大数据曾通过宏观数据和微观数据对中国教育行业的市场格局(含学前教育、小学、中学、高中等)进行深入研究,包括政府扶持、经济投入、区域市场竞争和发展潜力、网络舆情、资本关注等,从中挖掘了大量有利于教育产品发展的区域、投资回报率最高的教育市场区域等有价值的情报。

下面以学前教育市场为例,给大家示范如何利用公开的宏观和中观数据,结合特定的行业知识背景,拿出一份有价值的市场分析报告,作为企业进行市场拓展和产品战略的有力支撑。

一、案例背景

一大型教育企业正在推广一款TO C类学前教育产品,商业目标如下:

目标1:寻找TO C类学前教育产品的重点推广市场;

目标2:寻找开设新幼儿园的最佳地区;

二、 结合行业背景,确认数据分析的字段

首先,需要解读商业目标的潜台词:

大数据太高大上?看如何用中宏观“小数据”进行教育市场分析!-数据分析网

 

接着,选择数据分析的字段:

——这个时候,部分不懂行业背景的人就可能得到一个这样的阶段性结论:客户的需求很简单,无非就是用到3个最原始的数据:区域、学前教育适龄儿童人数、幼儿园数量。

——而稍微具备行业知识的分析师会知道,其实这个需求最终用到的是“区域”、“学前教育适龄儿童人数”、“幼儿园数量”、“幼儿园在校人数”、“学前教育毛入学率”5个数据指标。

因为 ——就我国目前的情况而言,区域经济较发达的地区对于学前教育的重视程度相对经济落后地区要高,而区域学前教育重视程度往往直接体现在入学率这一指标上。另外,适龄儿童往往体现的是区域常规的市场空间,但是真正反映到学前教育机构学生密度和饱和程度的需要观察的是幼儿园的在校人数。

——其实,如果还要更加深入分析的话,可能还会涉及到区域政府对学前教育经费的投入,各级别教育的支出分配比例等等,此处需要引入很多行业概念,所以就不一一进行解析了。

此处引用某分析师“老黄”的话:“在做分析之前,不看超过50篇相关的专业文章,你写出来的观点都是无效的观点”。

三、数据获取:爬取政府中宏观数据为主,人工采集补全

目前,我国80%的教育外部数据来源于国家统计局、国家教育部、各地市教育厅官网等,其结构化程度较高,大部分都可以通过简单爬虫或人工采集等方式去获取。

还有20%有用的教育数据散落在各大教育相关站点、新闻传媒、统计公报等非结构化数据源,其数据获取难度大、来源复杂,需要通过机器检索或人工采集方式去补全。

四、报告结果

此处仅节选展示报告正文中有关目标1和目标2的关键结果页面:

目标1:寻找TO C类学前教育产品的重点推广市场

大数据太高大上?看如何用中宏观“小数据”进行教育市场分析!-数据分析网

2016年我国学前教育适龄人口(3~5岁)超过5000万人,从各地区分布情况看,南部、东部和中部地区的学前教育适龄儿童人口总数明显超过西部和北部地区,对于幼儿园和幼儿教育产品的需求量会更大。

其中广东、河南两省的幼儿人数均超过350万人,是TO C类学前教育产品的重点发展区域。另外,山东、四川、河北、湖南、广西、江苏也是值得拓展的市场。而东北、西北和北部地区进行学前教育产品的推广难度相对较高,且利润空间有限。

需求2:寻找开设新幼儿园的最佳地区

大数据太高大上?看如何用中宏观“小数据”进行教育市场分析!-数据分析网

判断是否需要增建幼儿园,需要看两个基础的数据指标,幼儿园园所数量和在园幼儿人数。

幼儿园在园人数密度过高(幼儿园在园人数/幼儿园机构数)时,则说明地区的幼儿园数量已无法满足学生人数就读的需求,需要新增开设园所。主要有3种数据特点,即“园少人多”或“园多人多且密度高”或“园少人少且密度高”。

“园少人多”:江苏、安徽、湖北……

“园多人多且密度高”:广东、河南、浙江……

“园少人少且密度高”:辽宁、上海、宁夏……

由于“园少人少且密度高”的地区的学前教育适龄人口基数少,市场拓展价值相对较低,建议有限在“园少人多”和“园多人多且密度高”的地区新增开设幼儿园。且上图中偏离平均线(红)的程度越高,则说明机构饱和程度越低,市场发展潜力越大,即江苏、广东、河南、安徽、浙江、湖北。

大数据太高大上?看如何用中宏观“小数据”进行教育市场分析!-数据分析网

教育部要求到2016年全国学前三年毛入园率达75%,以2015年末的数据来看还有15个省份未达标。而在国家政策支持的形式下,入园率提升是必然趋势,因此学前教育结构和相关产品的需求量也会更加明显,故低入园率的教育大省(如河南、广东、四川等)的市场地位将显得更加重要。

市场分析结论

1.广东、河南、江苏省是学前教育重点的拓展市场,既有新办幼儿园机构的需求,又具备较大的适龄儿童基数可快速推广学前教育产品,且未来的发展形势利好;

2.山东、湖南、四川、河北、江西的学前教育机构已经近饱和或过饱和,不太适宜机构类拓展,但适龄人口基数大,具备产品类市场发展潜力;

3.辽宁、上海、宁夏等虽然适宜学前教育机构拓展,但是教育产品市场发展的基数小,不适应作为重点;

4.西藏、青海、天津等不适宜进行市场拓展,或是本身教育发展水平落后,或是本身发展空间有限。

(更多教育大数据解决方案请后台调戏小编哦~)

写在后面的话——

在大数据的光晕下,“小数据”其实也有它的魅力。毕竟我国的数据体系不像欧美等国家那么开放,很多个人数据短期内难以获取,更多的是集中在大型运营商和互联网等企业中。

而宏观数据相对而言是可获取性较强且完全公开的,在你没有数据积累的情况下学会解读它,能解决基本战略层面的很多问题。