张乐
-
用R语言进行数据分析:包
所有的 R 函数和数据集是保存在(packages)里面的。只有当一个 包被载入时,它的内容才可以被访问。这样做一是为了高效 (完整的列表会耗去大量的内存并且增加搜索的时间), 一是为了帮助包的开发者防止命名和其他代码的中的名字冲突。 这里,我们仅仅从用户的角度来 描述这个问题。 可以使用下面的命令…
-
用R语言进行数据分析:统计图形
图形工具是 R 环境里面一个非常重要和多用途的组成部分。 我们可以用这些图形工具显示 各种各样的统计图并且创建一些 全新的图。 图形工具既可交互式使用,也可以批处理使用。在许多情况下, 交互式使用是最有效的。 打开 R 时,它会启动一个图形设备驱动 (device driver)。该驱动会打开特定的…
-
用R语言进行数据分析:最小二乘法和最大似然法
特定形式的非线性模型可以通过广义线性模型 (glm()) 拟合。但是许多时候,我们必须把非线性拟合的问题 作为一个非线性优化的问题解决。 R的非线性优化程序是 optim() 和 nlm()。 二者分别替换 S-Plus 的 ms() 和 nlminb()。我们通过搜寻 参数值使得缺乏度(lack-…
-
用R语言进行数据分析:方差分析模型
方差分析和模型比较 模型拟合函数 aov(formula, data=data.frame) 和函数 lm() 非常的相似,在Generic functions for extracting model information 部分列出的泛型函数同样适用。 需要注意的是 aov() 还允许分析 多方…
-
用R语言进行数据分析:定义统计模型的公式
下面的统计模型的模板是一个基于 独立的方差齐性数据的线性模型 y_i = sum_{j=0}^p beta_j x_{ij} + e_i, i = 1, …, n, 其中 e_i 属于 NID(0, sigma^2)。 用矩阵格式表示,它可以写为 y = X beta + e 其中 y 是响应向…
-
用R语言进行数据分析:编写函数
正如前面内容所暗示的一样,R 语言允许用户 创建自己的函数(function)对象。R 有一些 内部函数并且可以用在 其他的表达式中。通过这个过程,R 在程序的功能性, 便利性和优美性上得到了扩展。学写这些有用的函数 是一个人轻松地创造性地使用 R 的 最主要的方式。 需要强调的是,大多是函数都作为…
-
这篇分析微博的文章被微博CEO王高飞打赏488元
今天(11月20日)早上8:33分,@新媒沈阳在微博发表了一篇名为《微博的三个不引人关注的新特点》的文章,很快受到微博CEO王高飞(@来去之间)的关注:“好的分析文章,是让被分析者能注意到一些平时关注不到的一些问题点,给 @新媒沈阳 的文章《微博的三个不引人关注的新特点》打赏488元!”本文来自@新…
-
正态分布的前世今生:最小二乘法
【编者注】几乎所有的经济模型都有假设前提,学过计量经济学的同学都知道古典假设,而正态分布又在假设中占有十分重要的作用,小编偶然间在我爱自然语嫣处理这个博客中发现了《正态分布前世今生》的系列文章,文章以名人、故事为主线简单的描述了正态分布的前世今生,这里特推荐给大家。 第二个故事的主角是欧拉(Eule…
-
吕良泽:如何用数据判断行业趋势?
摘要:这篇文章认为移动互联网时代的创业,是基于数据变化研究的知识技术密集性创业。创业者要学会用 “数据”,特别是 “数据变化率” 来判断行业趋势。 几天以来,微信朋友圈中一直热火朝天地讨论着的是天猫 “双十一” 912 亿元高得令人头晕目眩的交易额相关话题。惊羡之余,有几个朋友问:除了今年上半年新操…
-
柏睿数据董事长刘睿民:未来数据库行业大有可为
柏睿数据董事长兼CTO刘睿民 一个雨过的午后,风轻云淡,记者在望京SOHO的办公室采访了柏睿数据科技有限公司董事长兼CTO刘睿民。 数据库的故事 时代的变迁,科技的进步改变了我们的生活方式及思维方式,同样也改变了某个行业。刘睿民告诉记者,回顾过去30多年,整个数据库行业没有太大的变化,那时人们还使用…
-
开源机器学习平台H2O.ai,宣布完成2000万美元B轮融资
H2O.ai是初创公司 Oxdata 在去年末推出的一个独立开源机器学习平台,主要服务于数据科学家和开发者,为其应用提供快速机器学习引擎。 今日,H2O.ai宣布完成 2000 万美元 B 轮融资,由 Paxion Capital Partners(GoPro 董事会成员之一 Michael Mar…
-
常用的十种数据挖掘算法介绍
下面介绍十种数据挖掘(Data Mining)的分析方法,以便于大家对模型的初步了解,这些都是日常挖掘中经常遇到的算法,希望对大家有用!(甚至有数据挖掘公司,用其中的一种算法就能独步天下) 1、基于历史的MBR分析(Memory-Based Reasoning;MBR) 基于历史的MBR分析方法最主…
-
5种方法教创业公司如何利用大数据形成独特竞争优势
摘要:在全球知名咨询公司麦肯锡提出“大数据”时代到来之后,这一概念深入到各个行业之中,如今大数据在不断增长之中。各大公司都加快大数据的增长,Berkeley Research Group LLC的董事总经理John Kelly认为不仅仅是大公司,创业公司也应该加速大数据的增长,利用其形成独特的竞争优…
-
“热云数据” 获 5000 万元 A 轮投资,或从游戏产业链拓展到金融领域
摘要:热云数据近日宣布获得 5000 万元 A 轮融资,投资方为 “凌志汉理基金”。 热云数据定位为一家移动数据引擎公司。他们在做的事情我概括为两大步骤,第一步——收集数据;第二步——数据变现。 热云有 4.5 亿移动设备的去隐私数据,主要来自 4 大渠道:1.应用开发商嵌入的 SDK 收集的数据;…
-
数据可视分析中的知识产生模型
摘要:可视分析技术已经发展了近十年。在这些年间,人们研究了大量的可视分析方法和案例,发表了不少研究论文。然而,对于一些基本问题,人们依然没有明确的答案。例如,一个基本的可视分析流程是怎样的?一个可视分析系统应该包含哪几个组件?如何评价和比较不同的可视分析系统?