桃树科技TaoData完成A轮融资:专注“量产”数据科学家

桃树科技TaoData完成A轮融资,让繁琐的数据科学流程最简化

2017年2月,由光信资本领投,创新工场、线性资本、界石投资及头头是道跟投,其中创新工场更是超额跟投,桃树科技(TaoData)完成了A轮融资——这家以估值迅速增长闻名于业内的科技公司,在迈向人工智能独角兽的路上一骑绝尘。
▍桃树科技成立于2016年4月,于2016年5月获得线性资本、滴滴出行天使投资人王刚及同盾科技天使投资。

▍2016年10月,桃树科技获得创新工场、界石投资、线性资本及滴滴出行天使投资人王刚pre-A轮投资。

▍2017年2月,由光信资本领投,创新工场、线性资本、界石投资及头头是道跟投,其中创新工场超额跟投,桃树完成A轮融资。

桃树科技创始人杨滔的身上,有着许多亮眼的标签:

求学时期,是新西兰高考全国优秀毕业生,博士生导师口里最优秀的博士学生,以创历史的速度完成博士学业。

从学术圈转战业界,被上司喻为业内顶尖的数据科学家,建立淘宝数据科学团队,首创聚划算爆款模型。

从淘宝数据科学家到创业者,又一次勇敢的转身,弃下以往所有的荣誉和光环,踏上艰险新征程。

终点即是起点

“做出通用的数据科学产品,让繁琐的数据科学流程最简化。”是杨滔创业的初心。

创业最初的一段时间,杨滔做的最多的一件事,就是独自对着电脑闭关写代码。

在这关键的几个月,他用代码创造了一个又一个桃树机器人的雏形。当这些初级版桃树机器人应用在银行风控及精准营销项目后,效果斐然,项目周期从之前的半年缩短到了两周,同时模型效率显著提升。

然而,随着银行客户不断增多,项目经验越发深厚,杨滔很快发现最初设想的不足——“通用的数据科学产品”不应该是也不可能是数据科学家自己对着电脑设计出来的。

没有对客户需求的准确把握以及各行业业务专家的知识输入,所谓的“通用”仅局限于客户需求的浅层,无法产生颠覆性价值。

又一次放下,再一次启程。虽然此时桃树已有近20人的团队,这位一直以技术为刀剑闯荡江湖的数据科学家,决定背起电脑包,穿上运动鞋:回访核心客户、与业内专家沟通学习、深度参与项目进程……马不停蹄。

在矛盾中前进

“从应用入手,先以客户的需求为重点为客户创造价值,才是现阶段数据科学正真应用的方向。”杨滔不破不立的性格,被最大化的发挥在他创业之路上。

从通用数据科学产品到数据科学家深度参与的数据科学服务,看似背道而驰的两个方向,桃树说变就变。

新方向明确后,桃树团队将项目重点从技术研发转向深挖客户需求,从中提炼了桃树数据科学解决方案的关键——客户价值管理体系。

如今,桃树团队已将桃树数据科学解决方案已成功应用于金融行业,帮助多家知名企业建立客户价值管理体系(CVM)。

CVM是桃树科技服务企业的数据应用体系。这些应用点本身是最大化客户价值的完整闭环。

杨滔认为大数据企业服务的最终商业模式是“解决方案”服务。然而,大数据的解决方案服务并不是传统的咨询模式,而是“咨询+产品”的组合模式。

以桃树风控模型为例,其可以帮助银行信用卡中心审批带来的坏账率大幅度下降。然而,影响信用卡业务目标的不仅包括客户的坏账率,那些高价值客户可能有良好的信用,但可能选择竞争对手的消费信贷产品。因此,有经验的数据科学家会将客户流失预警模型与风控模型组合使用,最大化信用卡业务价值。

而在金融产品的营销中,首先需要找到适合该场景的营销人群,这需要精准营销模型。然而,即便精准营销模型再准确,仍然需要在合适的人群中为不同个体客户提供个性化产品推荐。精准营销模型用于筛选人群,个性化推荐模型用于为不同客户提供产品组合,二者的组合使用才可以最大化营销效率。

在桃树服务的企业客户中,许多企业最关注的并不是几个具体的应用,而是从基础层面了解客户信息。

企业不仅需要控制风险,更需要认识发生坏账风险最高的人群是否有共性,是否能从决策层面系统性规避高风险客户群体。企业不仅需要精准营销,更需要从客户特征中挖掘核心客户的人群画像,以及需要营销产品和其他产品或者场景之间的“关联营销规律”。企业不仅需要挽留高价值客户,更需要认识是什么造成了客户的流失以及挽回客户的核心手段。

不仅如此,企业决策者需要自动从客户群体中挖掘那些对业务价值贡献最高,并且具备共性的人群特征,从而以更高效率找到业务的整体定位。

快速试错,小步快跑,不断逼近目标,是杨滔一贯的做事风格。当很多人还在纠结观望祈求完美的时候,他往往已经开始行动。

DataBrain

人与机器的关系,在挫折与矛盾中上升:

当通用的机器学习产品无法深入客户需求时,数据科学家便是机器的老师,告诉机器哪些才是真正需要被关注及解决的问题;

当数据科学家的精力被大量的低级脑力劳动占据,机器便是人类最忠实的助手,不知疲倦的运作直至完成任务。

桃树正是在不断探索人与机器的矛盾与协作中,倔强成长:

最初的“通用化数据科学产品”构想被现实击碎,碎片散落到一个个定制化的数据科学服务——信用风控、精准营销、个性化推荐、客户分群,最终汇聚成客户价值管理体系。

桃树数据科学七剑体系的建立,将数据科学最核心的工作流固化,剑指咨询服务无法批量化复制的商业局限。从问题定义,到数据准备,算法调优,知识发现,效果分析,线上部署,模型更新,桃树数据科学七剑的核心价值是抽象了从数据到商业价值的核心环节。

无论创业的每一天是多么的分秒不懈,这“七剑”的每一篇文章每一个环节每一个字,都是杨滔精心设计编著而成。因为他坚信,当数据科学七剑被充分实现,桃树“人人都可以成为数据科学家”的使命便可以最终落地。

当为客户创造实际价值的咨询服务工作流可固化后,数据科学的核心技术也在逐渐沉淀成型。

桃树数据建模平台DataBrain,正是桃树核心技术沉淀而成的产品。DataBrain集“特征发现”、“特征工程自动化”、“算法调优”及“知识发现”等最精尖的数据科学技术为一体。

山重水复,DataBrain又重新突出了“通用化产品”的概念,但是内涵与之前已全然不同。基于客户成功案例的技术升级,让人工智能技术从理论趋势真正落地应用。桃树的目标,是将DataBrain做成数据科学的基础设施。

在上一轮融资后的访谈中,杨滔就提出:

“大数据的技术很难完全自动化或产品化,但其中有一部分是可以的。所以面向企业的数据科学服的最佳的方式是不断升级可以用通用的底层算法产品,再结合行业应用的解决方案去客户端落地。同时,不断把行业应用解决方案中可以产品化的部分再产品化,进一步结合工程师面向客户的行业经验,做出更好的解决方案。然后积累到足够经验,再不断把解决方案中可以产品化的部分产品化——如此循环递进,不断升级。

简而言之,数据智能化就是将业务经验数据化,并将解决方案中重复的及有规律的部分不断产品化,交给机器去做,使数据工程师与行业专家有更多的精力去解决业务中最核心的问题。”

短短数月,当初只在理想中的构思和方向,桃树都已逐渐一一实现。

就在两天前,桃树DataBrain的Atom 6.0版已正式发布,一个更强大的人机协作引擎已经准备好了迎接人工智能时代新的挑战。

“每当我研发Atom,我就感觉自己在塑造一个会学习的机器生命。当初之所以把公司叫做桃树,是因为希望‘桃李满天下’。人工智能时代,真正的强者绝不是取代别人,而是赋能于别人,让人人都成为武艺高超的数据科学家。”杨滔如是说。

注:数据分析网遵循行业规范,任何转载的稿件都会明确标注作者和来源,若标注有误或遗漏,请联系主编邮箱:afenxi@afenxi.com

分享到:更多

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址