张乐
-
三点经验给有志于从事数据分析师的年轻人
现在确实是属于数据分析师的天下了,如果你有能力,有经验,充满好奇心以及永不倦怠的热情,作为数据分析师的你可谓前景广阔,有一大批公司乖乖站在你家门前挂着牌子等着你的挑选。
-
5款主流NoSQL数据库全方位对比分析,到底哪家强?
HBase、Redis、MongoDB、Couchbase、LevelDB五款较主流的数据库产品分析对比
-
魅族莫涵宇:大数据平台的架构设计与实现
魅族Flyme大数据平台经理莫涵宇基于《魅族大数据平台架构实践》分享了魅族在人员变化、数据规模、业务支持等的DT转型和大数据历程。
-
微博6年Redis优化历程,用最少的机器支撑万亿级访问
微博是从 2010 年开始引入 Redis ,现在 Redis 已经广泛应用于微博的多个业务场景,如关系、计数、通知提醒等,目前 Redis 集群存储超过百亿记录,每天上万亿的读取访问。
-
文本数据的机器学习自动分类方法(下)
随着互联网技术的迅速发展与普及,如何对浩如烟海的数据进行分类、组织和管理,已经成为一个具有重要用途的研究课题。而在这些数据中,文本数据又是数量最大的一类。
-
文本数据的机器学习自动分类方法(上)
本文整理了文本分类的基本方法和处理流程,进行了综述性介绍。
-
R语言不平衡数据分类指南
在对不平衡的分类数据集进行建模时,机器学习算法可能并不稳定,其预测结果甚至可能是有偏的,而预测精度此时也变得带有误导性。
-
R语言中离群值的识别、描述、绘制与移除
统计学中离群值被定义为离开大部分观测较远的样本点,多数是由于测量误差而产生。因此,数据分析中离群值的识别和移除(如有必要)是很重要的一个步骤。
-
用“一袋子词”进行情感分析
很久以来,主流 NLP (Natural Language Processing)就在这样的一袋子词里面做文章,有时候也确实做出了蛮漂亮的文章,都是用的基于统计的机器学习。什么是“一袋子词”呢?
-
数据分析引擎“所问数据”获九合投资后,已启动Pre-A轮融资
“所问数据” 定位企业级数据分析的预测引擎,通过 SaaS 形式给企业提供深度销售分析和销售预测。
-
数据可视化工具大集合
所谓数据可视化是对大型数据库或数据仓库中的数据的可视化,它是可视化技术在非空间数据领域的应用,使人们不再局限于通过关系数据表来观察和分析数据信息,还能以更直观的方式看到数据及其结构关系。
-
Hadoop学习资源集合
Hadoop是一个由Apache基金会所开发的开源分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序,充分利用集群的威力进行高速运算和存储。Hadoop得以在大数据处理应用中广泛应用得益于其自身在数据提取、变形和加载(ETL)方面上的天然优势。Hadoop的分布式架构,将大数据处理引擎尽可能的靠近存储。
-
如何轻松搞定APP数据分析?
APP数据分析有意义吗?当然!数据分析的用意本不在于数据本身,而是要打造一个数据反馈闭环。
-
创业团队为什么要选择Oracle而不是MySQL?
『创业团队最佳选择是Oracle+MongoDB,而不是MySQL』,当深蓝在QQ群里抛出这样的观点的时候,就像是在马蜂窝里丢了一串鞭炮一样热闹起来。
-
BI与数据可视化
大数据时代已经来临,但数据本身是枯燥的、乏味的,如果不能进行可视化,人们很难发现它的价值,也不利于媒体进行传播。