hadoop
-
实现R与Hadoop联合作业的三种方法
为了满足用R语言处理pb量级数据的需求,我们需要把它和Hadoop联合起来使用。本文的目的就是阐述实现二者联合作业的不同技术。
-
数据科学家必备工具有哪些?
不是所有在这里提到的软件都会在你的工作中用到,但了解它们会让你拥有更多选择。
-
大数据时代下,信用卡公司如何发展?
作为数字化市场的监督者,信用卡公司能够俯瞰我们所购买的物品。
-
运行于云端的Hadoop——数据即服务的论证
在云端中运行一个高性能的大数据架构(如Hadoop和Spark)到底是否可行呢?
-
大数据分析界的“神兽”Apache Kylin有多牛?
Apache Kylin,中文名麒(shen)麟(shou) 是Hadoop动物园的重要成员。Apache Kylin是一个开源的分布式分析引擎,最初由eBay开发贡献至开源社区。
-
码农的良心推荐:9个最佳的大数据处理编程语言
大数据的浪潮仍在继续。它渗透到了几乎所有的行业,信息像洪水一样地席卷企业,使得软件越发庞然大物,比如Excel看上去就变得越来越笨拙。数据处理不再无足轻重,并且对精密分析和强大又实时处理的需要变得前所未有的巨大。
-
Uber的大数据之道:Spark已经是“必备神器了”
这一篇来自于Uber数据架构组,他们负责人Chandar说:Spark 已经是“必备神器了”。
-
Hadoop学习资源集合
Hadoop是一个由Apache基金会所开发的开源分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序,充分利用集群的威力进行高速运算和存储。Hadoop得以在大数据处理应用中广泛应用得益于其自身在数据提取、变形和加载(ETL)方面上的天然优势。Hadoop的分布式架构,将大数据处理引擎尽可能的靠近存储。
-
大数据兼BI平台AtScale完成1100万美元B轮融资
大数据与商业智能(Business Intelligence,简称 BI)创业公司AtScale在周一(5月16日)宣布,已在 B 轮融资中获得 1100 万美元资本。
-
数据科学是什么?如何才能把数据变成产品?
据哈尔?瓦里安(Hal Varian)说,统计学家是下一个性感的工作。五年前,在《什么是Web 2.0》里蒂姆?奥莱利(Tim O’Reilly)说“数据是下一个Intel Inside”。但是这句话到底是什么意思?为什么我们突然间开始关注统计学和数据?
-
你不需要Hadoop做数据分析的10个理由
为你的业务使用大数据技术是一个非常有吸引力的事情,现在Apache Hadoop使得它更加吸引人了。
-
解密Airbnb的数据科学部门如何使用R语言
我之所以在aribnb希望成为一名数据科学家是因为这里可以有一个非常多元化的团队来一起解决重要的现实问题。我们不仅仅在性别上多样化,而且在教育背景和工作经历也是霄壤之别。
-
什么样的SQL引擎能挑战运营、报表、分析三位一体化?
传统的关系型数据库虽然在解决大数据问题上力不从心,而SQL却是经过几十年考验的成熟技术。
-
数据分析师这个职业,是你的菜吗?
宽松的格子衫、酒瓶底一样的眼镜,这或许是大多数人对程序员这一群体的群体画像,但在大数据发展如此之快的今天,数据分析师已经成为一个新兴职业。这个听着就高大上的职业,你有没有想过也可以算得上是程序员的一个分支,他们的就业现状如何 数据分析师 与传统商业大为不同的是,随着互联网的快速发展,大数据时代已经悄然降临。数据分析师这个新兴职业需求量逐渐增多,大众对于数据分…
-
2016全球大数据战略版图剖析(3):分析篇(上)
为了更好的使大家了解行业现状,我们整理出了2016大数据版图英文对应公司的中文介绍,以飨读者。若与前文重复,则不再列出。