张乐
-
数据科学家如何玩台球? – 策略篇
准度提高没有那么快,在准度相对固定的情况下,要赢得比赛,需要怎么样的策略?
-
用户画像三个层次的认知与实践
个人对用户画像的理解是三个层次,可以说是三个步骤吧,从群体用户的问卷调研、数据分析到具象的个性描述,再到抽象应用
-
实现R与Hadoop联合作业的三种方法
为了满足用R语言处理pb量级数据的需求,我们需要把它和Hadoop联合起来使用。本文的目的就是阐述实现二者联合作业的不同技术。
-
统计错误让美国人更孤独
60 年前,只有9%的美国人独自一人居住,现在这一数字是28%,比爸爸妈妈跟孩子一起住的这种家庭数量还多。
-
数据分析在过去25年的回顾:大数据的下个转折点
这篇文章是一个投资者对数据分析在过去25年的回顾。作者西蒙迪斯从投资者的角度讨论了数据分析的变革,认知应用的价值,以及最受风投关注的大数据核心领域。
-
从好友推荐算法说起
社交网络中,好友推荐随处可见,这里探讨好友推荐是如何做的。 1、三元闭包理论 说到好友推荐,就不得不谈三元闭包理论。 三元闭包定义:在一个社交圈内,若两个人有一个共同好友,则这两个人在未来成为好友的可能性就会提高。 举例说明,若B、C有一个共同好友A,且B、C不认识,则B、C成为好友的几率会增加 这…
-
马云欲以“平台+金融+数据”再造一个阿里,蚂蚁金服2.5亿元入股中国私募数据服务商
6月10日下午,彭博社援引消息人士的说法称,本周早些时候,蚂蚁金服斥资2.5亿元(约合3800万美元)收购上海朝阳永续信息技术股份有限公司的20%股份。继朝阳永续的公司创始人、董事长廖冰之后,蚂蚁金服成为后者的最大股东。
-
数据产品的几种形态-仪表盘
对于数据产品的定义,我个人的理解是能够利用数据化的方式和方法解决业务过程中碰到的具体问题,提升工作效率,辨明决策方向,提高顾客体验,就能称之为数据产品。
-
基于Spark的文本情感分析
本文描述了基于 Spark 如何构建一个文本情感分析系统
-
如何使用R语言进行交互数据可视化
分享一些常用的交互可视化的R包
-
史上最全学习R语言资源
学习R大概有两年的时间了,自己收集了很多关于学习R的网络资料和书籍,今天拿出来和大家分享。
-
运用谷歌 BigQuery 与 TensorFlow 做公共大数据预测
谷歌BigQuery的公共大数据集可提供训练数据和测试数据,TensorFlow开源软件库可提供机器学习模型。运用这两大谷歌开放资源,可以建立针对特定商业应用的模型,预测用户需求。
-
2016年机器学习全力变革十大商业领域
机器学习正在提供市场所需的算法、应用,以及提高企业数据价值和预测精度的框架,帮助各种公司战略更快获得成功,创造比以前更多的收益。
-
大数据与统计新思维
在计算机科学、电子商务等领域已率先在大数据技术开发与应用方面做出不俗成就的时候,以数据为研究对象的统计学该如何应对?
-
数据分析入门之随笔记
数据分析是一个大话题,借这篇小笔记整理一下自己的思路:数据分析是什么?涉及到哪些技术?有哪些数据公司玩家?如何定位数据分析的价值?