张乐
-
星环科技获1.55亿元B轮融资,定位做Hadoop时代的Oracle
3月1日,星环科技已完成 1.55 亿元的 B 轮融资,由上海瑞力投资、深创投、中小企业发展基金、基石资本等投资。本轮融资之前,星环科技共完成天使轮 /A 轮 /A+ 轮三轮融资,总金额达 7000 万人民币。投资方有方广资本、启明创投等知名 VC,以及恒生电子等上市公司,并在 B 轮继续跟投。 简…
-
谁说菜鸟不会数据分析(入门篇)读书笔记
摘要:无论是产品经理,还是产品运营,数据分析都是每个产品汪/运营喵必备技能。 这篇读书笔记之前是存到Evernote的,现重新归纳共享。 相信这本书很多人都已经看过了,看过的朋友就当回忆了~没有看过的朋友牢记,对于数据分析方面来讲,这些内容用来打基础还是很有帮助的~ 同样,需要PDF的同学,底部有下…
-
大型网站架构系列:电商网站架构案例
摘要:大型网站架构是一个系列文档,欢迎大家关注。本次分享主题:电商网站架构案例。从电商网站的需求,到单机架构,逐步演变为常用的,可供参考的分布式架构的原型。除具备功能需求外,还具备一定的高性能,高可用,可伸缩,可扩展等非功能质量需求(架构目标)。 根据实际需要,进行改造,扩展,支持千万PV,是没问题…
-
机器学习大事记:66年机器学习发展进程
「机器人会梦见电子羊吗?」仍不失为一个好问题(译者注:《机器人会梦见电子羊吗?》(Do Androids Dream of Electric Sheep)为菲利普·迪克所著科幻小说,电影《银翼杀手》根据该小说改编而成),但是科学事实已经发展到开始与科幻小说相吻合的程度了。不,我们(目前)还没有造出挣…
-
以性别预测为例,谈谈数据挖掘中的分类问题
摘要:互联网的迅猛发展,催生了数据的爆炸式增长。面对海量的数据,如何挖掘数据的价值,成为一个越来越重要的问题。本文首先介绍数据挖掘的基本内容,然后按照数据挖掘基本的处理流程,以性别预测实例来讲解一个具体的数据挖掘任务是如何实现的。 数据挖掘的基本内容 首先,对于数据挖掘的概念,目前比较广泛认可的一种…
-
干货分享:史上最全大数据分析工具
摘要:以下是整理的关于数据分析的最全信息,包括微信大数据分析、数据可视化工具、词频分析工具、舆情分析工具、PPT模板工具、互联网趋势分析工具、在线调查工具、网站分析监测工具、社交媒体监测工具等。 微信大数据分析工具 新媒体指数:http://www.gsdata.cn 清博大数据-新媒体指数(www…
-
别笑,雅虎也有人工智能的秘密武器
摘要:又一个科技巨头与世界分享它的人工智能成果了。2月24日,雅虎公布了 CaffeOnSpark 人工智能引擎的源代码,从学术研究者到大公司员工都可以使用或修改。 也许近年来很少人了解雅虎在科技界的实力。它孵化了开源项目 Hadoop——被 Facebook、Twitter 和许多其他公司广泛使用…
-
联合交通数据拥有方 “华视互联” 和数据加工方 “北斗技术研究院”,TDEP 希望做一个交通数据交易平台
摘要:有价值的数据来自于交易和共享,而大数据必须跟行业结合才会产生价值。对于交通而言,其问题在于产生拥堵、安全问题与环境问题。那么,交通由数据来驱动的话可以在哪些方面有所作为呢?可以想到的有交通运力设计、路网线网设计、生活设施配套、以及城市规划设计等。而要让数据真正流转起来,需要将交通数据的拥有方、…
-
为什么跨设备数据将成为企业新宠?
摘要:本文作者 Brian Ferrario 是一名营销经理,在本文介绍了跨屏设备在日常生活中的应用以及发展趋势。 近年来,消费者在手机端和桌面端的活动界限正逐渐模糊。无论操作内容是什么,你实际用的是哪种设备已经越来越无关紧要。 拥有银行账户的智能手机用户中,一半以上使用手机银行。“黑色星期五” 期…
-
互联网人群画像和你所不知道的真相(二)
Mobile端用户和跨终端(跨屏)的唯一身份识别问题,同样是理想和现实并存的故事
-
数据杂谈
摘要:记得几年前,曾经有人预测过未来最流行的三大技术:大数据、高并发、数据挖掘。到现在来看,这三种技术的确也随着这几年互联网的发展变得越发成熟和可靠。掌握这三种技术的人,不管是求职还是创业,都属于香饽饽。 一个很深的印象就是当年研究生毕业的时候,专业是数据挖掘、大数据的学生都比较受各种企业的青睐,不…
-
为什么会有深度学习?如何看待?
摘要:最近,深度学习成为一个流行语。有分析人士称,它会吞噬掉目前已知的其他机器学习(ML)方法。其他人则将深度学习的市场形容为一个金矿,称该技术有望取代整个行业和应用的大量人力干预。在本文,我试着简化深度学习的概念,并对其未来在 ML 生态系统的发展做了一些观察。 有趣的是,深度学习的概念并不是新出…
-
Hadoop数据操作系统YARN全解析
摘要:Hadoop 2.0引入YARN,大大提高了集群的资源利用率并降低了集群管理成本。其在异构集群中是怎样应用的?Hulu又有哪些成功实践可以分享? Hadoop YARN的生态系统 为了能够对集群中的资源进行统一管理和调度,Hadoop 2.0引入了数据操作系统YARN。YARN的引入,大大提高…
-
R语言 vs Python:数据分析哪家强?
摘要:这篇文章旨在更客观地看待这两门语言。我们会平行使用Python和R分析一个数据集,展示两种语言在实现相同结果时需要使用什么样的代码。这让我们了解每种语言的优缺点,而不是猜想。在Dataquest,我们教授两种语言,并认为两者在数据科学工具箱中都占据各自的地位。 我们将会分析一个NBA数据集,包…
-
互联网人群画像和你所不知道的真相(一)
作为新时代互联网营销的关键部分,人群画像引起了诸多兴趣,近年颇为风靡。几乎所有的互联网广告供应商都不约而同的强调,他们有足够精确的人群画像数据,确保能够找到广告主真正的受众。但是事情果真如此吗?人群画像是否是一劳永逸的解决方案?本文尝试解答这些问题。