张乐
-
商业智能BI三层结构:数据报表、数据分析、数据挖掘
经过几年的积累,大部分中大型的企事业单位已经建立了比较完善的CRM、ERP、OA等基础信息化系统。这些系统的统一特点都是:通过业务人员或者用户的操作,最终对数据库进行增加、修改、删除等操作。上述系统可统一称为OLTP(Online Transaction Process,在线事务处理),指的就是系统…
-
从内部机理的角度,详细分析Hadoop的核心架构
通过对Hadoop分布式计算平台最核心的分布式文件系统HDFS、MapReduce处理过程,以及数据仓库工具Hive和分布式数据库Hbase的介绍,基本涵盖了Hadoop分布式平台的所有技术核心。 通过这一阶段的调研总结,从内部机理的角度详细分析,HDFS、MapReduce、Hbase、Hive是…
-
数据挖掘公司D square nv完成500万欧元B轮融资
摘要:D square nv日前完成 500 万欧元 B 轮融资,融资方为 Gemma Frisius Fonds, Jürgen Ingels, Limburgse Reconversie Maatschappij, Fortino Capital。 D square nv 成立于 2007年12…
-
用文本挖掘技术分析电商非结构化的评论数据
电商平台中有海量的非结构化文本数据,如商品描述、用户评论、用户搜索词、用户咨询等。这些文本数据不仅反映了产品特性,也蕴含了用户的需求以及使用反馈。通过深度挖掘,可以精细化定位产品与服务的不足。下面描述了电商平台下机器学习在文本挖掘的应用例子。 1、用户评论分类 场景 用户评论能反映出用户对商品、服务…
-
云思:2016年市场研究十大趋势
转眼2015年就要过去,市场研究行业迎来的将是挑战巨大的一年。但机会往往是从危机当中产生,我们预计2016年也是中国市场研究行业通过创新而转型的一年。 宏观经济不景气必然对市场研究行业造成巨大冲击。2016年中国经济和企业所面临的压力将是巨大的,经营压力使得企业需要压缩不必要的预算。而在很多企业中,…
-
MIT课程笔记:数据可视化会撒谎
这篇文章取材于David Karger教授讲授的Data Visualizations课程,此课程是MIT ProfessionalEducation开设的网络课程Tackling the Challenges of Big Data的一部分。文中部分图片经Karger教授本人授权,请勿转载。 上一…
-
数据模型需要多少训练数据?
摘要:毫无疑问机器学习是大数据分析不可或缺的一部分,在使用机器学习技术的时候工程师除了要选择合适的算法之外还需要选择合适的样本数据。那么工程师到底应该选择哪些样本数据、选择多少样本数据才最合适呢来自于Google的软件工程师Malay Haldar最近发表了一篇题为《数据模型需要多少训练数据》的文章…
-
硅谷大数据公司Palantir获8.8亿美元融资,估值达200亿美元
摘要:在这个月中旬的时候,有报道称 Palantir 在新一轮融资中获得1.29 亿美元投资。实际上 Palantir 本轮的融资金额要远远高于这个数字。 在这个月中旬的时候,有报道称 Palantir 在新一轮融资中获得1.29 亿美元投资。实际上 Palantir 本轮的融资金额要远远高于这个数…
-
世纪佳缘用户推荐系统演变的故事
摘要:世纪佳缘用户推荐系统演变史 作为国内最大的婚恋交友系统,世纪佳缘近年来一直在大力发展互联网大数据相亲模式,从成立之初会员自己根据条件“大海捞针”的寻找,到现在的“懂你”系统、“人脸识别”系统,世纪佳缘的用户推荐系统正在一步步的完善和拓展,大数据相亲已经成为互联网婚恋交友网站的发展趋势。 世纪佳…
-
以“草船借箭”为例,我们讲讲大数据建模
鲁迅评价诸葛亮“多智而近妖”,此话见诸《中国小说史略》,意思说诸葛亮足智多谋,像个妖怪。 而如今,从 大数据 的角度看,诸葛亮的足智多谋是因为他掌握了数据建模的办法。 今天,我们就来说说这诸葛先生的“数据建模”之道。 建模里的“模”是指模型。使材料成为一定形状的工具,就属于“模型”,这些模型看得见摸…
-
赵刚博士:大数据牵引产业升级与企业创新
12月10日,以“互联网+时代的数字化转型与服务创新”为主题的第六届中国客户管理大会暨中国客户管理创新论坛在京举行。本次论坛由中国客户管理网携手清华大学创业研究中心、中国互联网金融研究院、清华校友总会互联网和新媒体协会、清华大数据产业联合会、中国客户管理研究院以及金融客咖啡等知名企业联合发起。 北京…
-
微软收购跨平台大数据分析初创公司 Metanautix
微软今天宣布,公司刚收购初创公司 Metanautix,此次收购详情并未披露。Metanautix 主要致力于帮助公司简化跨平台的大数据分析。 Metanautix 由前 Google 和 Facebook 高管创立于 2012年,公司服务于 2014年9月 正式推出,推出前还曾获得过一轮 700 …
-
Google,一个会思考的深度学习系统
“深度学习” 需要用到大型计算机集群来吸收数据(如图片)对其进行自动分类。Google 的 Android 语音控制搜索、图像识别及 Google 翻译等均采用了这项技术。 2012年6月,纽约时报曾报道了 Google 如何通过向 “DistBelief” 提供数百万份 YouTube 视频来让该…
-
有没有主宰世界的主算法?
摘要:算法日益影响着我们的生活,有没有主宰世界的主算法? 算法日益影响着我们的生活。但是在它正常运转的大部分时间里我们却没有留意,只有在算法出问题的时候才注意到它的存在。只有在那时候我们才回想起这个世界对算法—那些统治着我们周围所有计算机的、对人类来说日益费解的规则,是如何的依赖。一旦算法出了问题,…
-
云成本监控初创企业Cloudyn获1100万美元融资
摘要:现在是云的时代,越来越多的企业把自己的服务迁往云端,在云方面的支出也越来越多。 现在是云的时代,越来越多的企业把自己的服务迁往云端,在云方面的支出也越来越多,这通过一个数据可见一斑:最近 3 个月AWS 的业务收入就达到了 20 亿美元。但相对于本地部署,云服务的消费显得没那么透明,难免引起业…