摘要:TalkingData CEO崔晓波分享了在科技、数据、技术、商业模式创新上的经验与积累。本文对大会内容做了不改变愿意的删减和整理。

TalkingData崔晓波:我们用机器学习把北京的所有人分成了七类-数据分析网

数据是近年来国内外学术界和业界一直热度不减的话题。过去六年来,随着移动网络、IoT领域的发展,数据量在以指数级的速度爆发,整个世界数字化的速度在加快。9月11日至12日,以“知机识变 有唐之盛”为主题的T11 2017暨TalkingData智能数据峰会在北京举办。

作为月活6.5亿、以三倍速度增长的移动数据服务商,TalkingData此次主办的峰会吸引了来自来自斯坦福、哈佛、清华、人大、同济等高校和政府、研究机构的学者,以及来自IT、大数据、互联网、金融、地产、零售、教育等行业的技术专家与企业管理者。峰会中,TalkingData CEO崔晓波分享了在科技、数据、技术、商业模式创新上的经验与积累。本文对大会内容做了不改变愿意的删减和整理。

认识世界的角度正在由实体物质化,向数字虚拟化转变

崔晓波:我们以前研究市场、研究消费者,已经习惯了用一种片面的、基于时间切片的、基于很小样本量的、基于非常弱的论据做出很多决定。从企业、政府、各种各样的组织,真正做出决定的时候,只要看到这样的数据就做出一个非常大的决策。如果我们面临这样一个世界,是在指数级变化,不停在变,而我们收集数据的能力、速度、维度已经达到前所未有时代的时候,我们怎么理解这个世界?

人们看世界的角度会发生很大的变化,由实体物质化向个数字虚拟化的方向去转变,以下面的两个案例说明。

首先,谷歌的无人驾驶是怎么做的呢? 放置很多的勘测设备,包括无人车本身,然后在一个城市里面不断的收集数据,为什么收集数据?是因为避障吗?为了做模型吗?都不是,是为了建设数字化的城市。把所有的建筑、街道、道路、树木、障碍物,甚至行人都用数字化的方法表示。用数字化、虚拟化得方法AI迅速理解真实世界,帮助AI了解人类,这是我们看到的趋势。

第二个案例就是政府的统计数据。政府其实非常需要一些与人相关的基础的数据。国家统计局十年一次人口普查,抽样率1%到3%,而且数据是非实时的,完全感觉不到一个城市是变化的。而换一个角度,把所有的数据实时化、动态化的来表示,比如研究人在城市里面一天到底是怎么运动的、怎么交互的、怎么社交的、怎么通勤的,将会看到一些非常有趣的结论。我们用AI,机器学习的方法自动的把北京的所有人群做了归类。七类,这是机器学出来的,但是仔细分析还是挺符合人的认知的。所以,未来很多事物的研究方法和角度一定会发生非常大的变化。

TalkingData崔晓波:我们用机器学习把北京的所有人分成了七类-数据分析网

数据改变企业决策,数据改变人类生活

崔晓波:未来会有越来越多的企业,基于AI动态模型相结合,在虚拟世界和现实世界转换中,增强我们对世界的感知和认知能力。

这种感知和认知能力会改变商业决策和人类生活。比如上面说到的北京的人群归类,这种新的方法会带来城市治理思路的改变,会带来规划的改变,会带来公用设施的改变。在分布学区、分布医院、分布各种各样设施的时候,不再像原来那样简单地说南城是一个阶层、金融从业人员是一个阶层,而应该按他们的生活方式来分,这样城市才是有活力的。

大数据的概念已经被炒了八年了,热度一点都没有减。企业有非常紧迫的需求去做大数据系统,要去利用数据的能力去转型升级,寻找新的跨界之路。但是企业的高层也很困惑,大数据这个领域都炒了八年了,到底有没有效果?要解决这个问题,需要洞察到一些规律,数字回报定律。在指数级的世界里,数据驱动型企业的商业价值符合摩尔定律。当任何专业领域,技术产业能够活用数据,得到数据驱动助力的时候,它的回报就是能够实现指数级的增长。

TalkingData崔晓波:我们用机器学习把北京的所有人分成了七类-数据分析网

数据赋能合作伙伴,打造合作伙伴生态

在峰会中猎云网记者了解到,TalkingData 今年开始着力打造的合作伙伴生态体系(TPN),是一个基于TalkingData智能数据平台包含数据、技术、方案集成等多类合作伙伴的协作平台。

据TalkingData产品副总裁闫辉介绍,TalkingData的整个数据智能平台分成了两种应用:一个是自主研发的应用,另外一个域上是TalkingData的合作伙伴做合作的应用。在自主研发应用上,期望用战略的数据指导运营的方式,用洞察结果驱动增长的行动,利用合作伙伴的行业理解去沉淀更多的场景服务。关于战略分析洞察和具体的营销行动工具,这是一个横向面的需求,适用于普适性的所有行业。

在具体到营造数据生态的相关措施方面,TalkingData合伙人林逸飞透露:

第一,在开放形态下,在SmartDP逻辑上,数据本身就在为合作伙伴、客户做相应的服务。

第二,会做一个叫数据沙箱的服务推向市场,沙箱相当于是一个隔离运行的环境,它会把TalkingData的数据以及合作伙伴的数据和模型在一定算法的工具支撑下做相应的探索。将这样的合作产出的方案或者模型作为一种输出。

第三,在横向上会扩展更多的数据级,包括在无人驾驶、IoT领域以及医疗卫生领域。把TalkingData自己的智能数据平台的数据智能加工,应用到最多的数据级。数据级其实是垂直方向上的,在不同层面上都有相应的不同数据级可以开放出来供使用。灵活性越往里走,宽广程度和灵活性更高。