大数据
-
中科院数据科学家李国杰:大数据刚刚过了炒作的高峰期
李国杰,长期从事国家863计划高技术研究,1995年当选中国工程院院士,2002年当选第三世界科学院院士。现任国家“973计划”项目首席科学家,中科院计算所首席科学家,曙光公司董事长、中国计算机学会名誉理事长、国家信息化专家咨询委员会信息技术与新兴产业专委会副主任、中国科学院学位委员会副主席等职。 …
-
用贴近生活的几个例子告诉你:什么是大数据医疗?
大家都清楚医疗数据被安全地存储有多关键。谁也不希望自己的诊疗病例转眼就不见,明天要做手术的患者,今天忽然所有病例都不见了,可见是多么恐怖的一件事情。
-
大数据相关术语解释及中英文对照
大数据,或称巨量资料,指的是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
-
美团的推荐算法实践
前言 推荐系统并不是新鲜的事物,在很久之前就存在,但是推荐系统真正进入人们的视野,并且作为一个重要的模块存在于各个互联网公司,还是近几年的事情。 随着互联网的深入发展,越来越多的信息在互联网上传播,产生了严重的信息过载。如果不采用一定的手段,用户很难从如此多的信息流中找到对自己有价值的信息。 解决信…
-
YouTube上最火的十个大数据视频
无论你对大数据一无所知,还是想要拓展机器学习方面的知识; 无论你只有三个小时,还是三分钟; 无论你是想进一步了解这个技术还是那些高级应用,这个列表列举了YouTube上最棒的大数据视频。点击播放,使用这个高效的方式来探索大数据领域吧。 (关于视频:我们挑选的是YouTube上“Science and…
-
大数据公司Splunk和Cloudera的核心竞争力在哪里?
像硅谷这种初创公司Splunk和Cloudera,他们的核心竞争力究竟在哪里?
-
为什么BI项目会失败,怎么才能取得成功?
在现实中,一个BI项目可能涉及到几个不同的工具:一个真正的“BI”工具,简单的仪表板工具(这可能不是一回事),查询数据工具,以及如Tableau的“快速点击”工具。
-
开源大数据查询分析引擎现状
按:这些基础性的研究和测试对比分析,对于我们的BDSA技术路线选定大有帮助。 引言 大数据查询分析是云计算中核心问题之一,自从Google在2006年之前的几篇论文奠定云计算领域基础,尤其是GFS、Map-Reduce、 Bigtable被称为云计算底层技术三大基石。GFS、Map-Reduce技术…
-
傅志华:腾讯,阿里,百度,3家BAT企业“玩”大数据?
互联网行业在大数据的积累和应用以百度、腾讯和阿里巴巴最为值得关注。百度、腾讯和阿里巴巴在大数据的应用上虽然有共同的地方,但由于各自的数据来源和商业模式的不同,其大数据应用也有不同的特色。本文将分析他们拥有的数据资产和应用,以方便大家了解大型互联网企业的大数据现状和未来策略。 百度、阿里巴巴和腾讯的数…
-
一个言必称“大数据”的时代:国外大数据新闻资源分享
我们进入了一个言必称“大数据”的时代,以致这个出现不过两年的概念似有被滥用之嫌。但无可否认的事实是,全球各地政府、企业,乃至个人每天都在制造着海量数据。这些数据中又往往隐藏着“独家猛料”,吸引着越来越多的记者投身其中,进而在新闻行业中催生了数据新闻(Data Journalism)这一时髦的分枝。
-
如何修炼成大数据高手?推荐你看这些书
这个世界的本质是统!计!的!
-
从美国总统大选看大数据时代的数据新闻报道
数据新闻是在大数据时代兴起的一种跨学科、跨领域的新闻生产方式,它需要新的思维方式与多种能力的支撑。本文结合2012年美国总统大选报道,着重分析了英美各大主流媒体开展数据新闻报道的流程与特点。还探讨了社会化媒体对于数据新闻的推动作用,以及数据新闻的兴起与发展给新闻业者所带来的挑战。 在当前技术高速发展…
-
分步教程:如何成为一名数据科学家?
“Data Science = statistics who uses python and lives in San Francisco”
-
继Cloudera之后,MapR宣布对Spark的完全支持
Spark,发源于美国加州大学伯克利分校AMPLab的集群计算平台,当下已成为Apache基金会的顶级项目。而在不久前,知名Hadoop解决方案供应商Cloudera已宣布了其发行版对Spark的支持。毫无疑问,Spark已成为流行的大数据计算框架之一,而据Gigaom Derrick Harris…
-
大数据领域的顶级开源工具大集合
如今,从小型初创企业到行业巨头,各种规模的供应商都在使用开源来处理大数据和运行预测分析。本文介绍了一些大数据方面的顶级开源工具,分为四个领域:数据存储,开发平台,开发工具和集成,分析和报告工具。