张乐
-
德国大数据初创企业data Artisans 宣布获得550万欧元A轮融资
德国大数据初创企业 data Artisans 刚刚宣布获得了 550 万欧元的 A 轮融资。 data Artisans 是一家总部位于德国柏林的大数据初创企业,成立于 2014年。不过他们的技术其实早在 2008年 就已经开始研发,当时是作为柏林理工大学一个研究性项目,这也就是 Flink 的前…
-
你难道仅仅是个数据工具使用者吗?
有时候会听到有人说:「我终于学会用R了」,「我终于学会用SAS了」…… 高兴之余,我不免要说,这可能有点伪命题的意思。R、SAS、Excel等等都只是工具,使用工具是为了解决某种问题,而问题本身有往往有不同的场景(不可穷举),有可能你会用工具解决这个问题,却不会用工具解决另一…
-
淘宝实战——教你数据挖掘好方法
摘要:下面通过4种对应的场景来帮助读者理解数据挖掘的4种任务。 (1)老板要求小白做一份市场分析——预测。 拿到市场分析的数据源后就要明确知道,分析市场最主要的价值就在于“先知”,即比竞争对手提前预知市场行情。因此接到市场分析的工作后,不用迷茫,预测是它的价值所在。 (2)老板要求小白对店铺的日常数…
-
推荐系统算法初探
0. 序言 最近因为PAC平台自动化的需求,开始探坑推荐系统。这个乍一听去乐趣无穷的课题,对于算法大神们来说是这样的: 而对于刚接触这个领域的我来说,是这样的: 在深坑外围徘徊了一周后,我整理了一些推荐系统的基本概念以及一些有代表性的简单的算法,作为初探总结,也希望能抛砖引玉,给同样想入坑的伙伴们提…
-
开源可容灾数据库CockroachDB获2000万美元融资并开放公测
可实现跨数据中心同步的可伸缩开源数据库 CockroachDB 母公司Cockroach Labs近日获得了 2000 万美元的 A1 轮融资。 Cockroach Labs 是一家开源基础设施解决方案提供商,由前 Google 软件工程师 Spencer Kimball、Peter Mattis …
-
大数据旅游网站Hopper获新一轮1600万美元融资
基于大数据的旅游网站 Hopper 获新一轮 1600 万美元的融资,由 BDC 投资。 2012年,这家秘密开发了 5年 的旅游网站曾经宣布完成 B 轮融资,获得 1200 万美元投资,当时的投资方为 OMERS Ventures、Brightspark Ventures。到目前为止,Hopper…
-
Spark在美团具体应用场景下的实践
前言 美团是数据驱动的互联网服务,用户每天在美团上的点击、浏览、下单支付行为都会产生海量的日志,这些日志数据将被汇总处理、分析、挖掘与学习,为美团的各种推荐、搜索系统甚至公司战略目标制定提供数据支持。大数据处理渗透到了美团各业务线的各种应用场景,选择合适、高效的数据处理引擎能够大大提高数据生产的效率…
-
10个表明数据科学能力成熟的迹象
如果你想造一艘船, 不要鼓励人们去伐木、去分配工作、去发号施令。 你应该做的是,教会人们去渴望大海的宽广无边和高深莫测。 ——安东尼·德·圣-埃克苏佩里 在我们与美国政府、商业和国际组织的多年合作工作中,我们已经具备了帮助我们的客户设计和建立一个数据科学功能以支持和驱动他们的任务的能力。这些任务包括…
-
Spark知识体系完整解读
摘要:2014年6月至今工作于北京亚信智慧数据科技有限公司 BDX大数据事业部,从2014年9月开始从事项目spark相关应用开发。 Spark简介 Spark是整个BDAS的核心组件,是一个大数据分布式编程框架,不仅实现了MapReduce的算子map 函数和reduce函数及计算模型,还提供更为…
-
万变归宗:数据分析市场能不能做?能做多大?
摘要:做淘宝就是做数据,运营其实就是把店铺的数据展示给淘宝看。 从这个角度讲,做运营其实很简单,不管你用什么手段,只要能让淘宝认为你是优秀的即可。 所以,数据就是运营的作业,也是运营的眼睛,没有数据,运营就是瞎子。 我们经常通过点击率来验证商品主图是否受买家喜欢,通过静默转化率来验证商品详情页是否能…
-
如何构建一个高效的数据科学部门
译者注:ETL – Extract Transform Load 抽取 转换加载,代表从源数据清洗加工到数据仓库的过程。 这篇文章在Hacker News转载后产生很热烈的讨论,主要是从工程师的角度来看问题,讨论了很多有关人员管理和团队分工等一些很现实的问题。不是所有人都同意文中的观点和…
-
未来10年,大数据和人工智能将重塑这三大产业
我们生活在一个充满颠覆和变革的时代,而这并不是件坏事。产业将会转型,大企业面临衰亡。为了给消费者提供更好、更快、更低价的体验,企业家们逐步对低效的企业、产品及服务进行优化及重塑,旧有的系统将会瓦解。 华盛顿大学奥林商学院的研究表明,在未来十年内,当今世界 500 强企业中将有 40%不复存在。在接下…
-
利用Python分析背单词软件的惊人真相
摘要:利用python分析背单词软件,揭秘你不知道的惊人真相 0×00 前言 你想知道背单词软件有大概多少人注册第一天都没有背完嘛 你想知道背单词软件这么火,这么多人在使用,真的有多少人真的在背诵嘛 别急,Python程序员用数据给你说话. 文章目录如下: 0×00 前言 0×01 问题的提出和任务…
-
Uber的大数据分析实践,及其惊人的表现
摘要:Uber是一款提供出租车预订服务的智能手机应用,为需要搭车的用户和想要载客的司机搭建了沟通渠道。这项服务引起了很大争议,一方面普通的出租车司机抱怨Uber毁掉了他们的生计,另一方面民众担心Uber的司机缺乏监管。 但这些争议并没能阻止Uber取得巨大的成功:2009年发布时仅覆盖旧金山一地,到…
-
海纳百川 有容乃大:SparkR与Docker的机器学习实战
题图为美国尼米兹核动力航空母舰 介绍 大数据时代,我们常常面对海量数据而头疼。作为学统计出身的人,我们想折腾大数据但又不想学习Hadoop或者Java,我们更倾向于把精力放在建模和算法设计上,SparkR和Docker的完美结合,让R的计算直接从一架战斗机的当兵作战华丽转变为一个航空母舰战斗群!不仅…