R语言

  • 用一行R代码,实现繁琐的数据可视化

    摘要:看完这篇文章,可视化不再是难题。 ggfortify 是一个简单易用的R软件包,它可以仅仅使用一行代码来对许多受欢迎的R软件包结果进行二维可视化,这让统计学家以及数据科学家省去了许多繁琐和重复的过程,不用对结果进行任何处理就能以 ggplot 的风格画出好看的图,大大地提高了工作的效率。 ggfortify 已经可以在 CRAN 上下载得到,但是由于最…

  • 用R语言进行数据分析:常用函数参考

    基本 一、数据管理 vector:向量 numeric:数值型向量 logical:逻辑型向量 character;字符型向量 list:列表 data.frame:数据框 c:连接为向量或列表 length:求长度 subset:求子集 seq,from:to,sequence:等差序列 rep:重复 NA:缺失值 NULL:空对象 sort,order,…

    2015-11-22
  • 用R语言进行数据分析:命令行编辑器

    C.1 预备工作 如果你的 UNIX 系统已经安装了 GNU readline 库, 那么 R 配置中允许在 UNIX 下编译 R 代码,调用内置的 命令行编辑器,编辑和重新调用以前用过的命令。 注意:该附录提到的接口不是用于 UNIX 系统的 GNOME接口,而仅仅用于标准的命令行 接口。 如果启动时设置了参数 –no-readline (使用…

    2015-11-22
  • 用R语言进行数据分析:一个简单的会话

    下面的会话让你在操作中对 R 环境的一些特性有个简单的了解。你对系统的许多特性开始时可能 有点不熟悉和困惑,但这些迷惑会很快 消失的。 登录,启动你的桌面系统。 $ R 以适当的方式启动 R。R 程序开始,并且有一段引导语。 (在 R 里面,左边的提示符将不会被显示防止 混淆。) help.start() 启动 HTML 形式的在线帮助(使用你的计算机里面 …

    2015-11-22
  • 用R语言进行数据分析:包

    所有的 R 函数和数据集是保存在(packages)里面的。只有当一个 包被载入时,它的内容才可以被访问。这样做一是为了高效 (完整的列表会耗去大量的内存并且增加搜索的时间), 一是为了帮助包的开发者防止命名和其他代码的中的名字冲突。 这里,我们仅仅从用户的角度来 描述这个问题。 可以使用下面的命令查看你当前环境中安装的包 > library() 命令…

    2015-11-22
  • 用R语言进行数据分析:统计图形

    图形工具是 R 环境里面一个非常重要和多用途的组成部分。 我们可以用这些图形工具显示 各种各样的统计图并且创建一些 全新的图。 图形工具既可交互式使用,也可以批处理使用。在许多情况下, 交互式使用是最有效的。 打开 R 时,它会启动一个图形设备驱动 (device driver)。该驱动会打开特定的图形窗口(graphics window)以显示 交互式的图…

    2015-11-22
  • 用R语言进行数据分析:最小二乘法和最大似然法

    特定形式的非线性模型可以通过广义线性模型 (glm()) 拟合。但是许多时候,我们必须把非线性拟合的问题 作为一个非线性优化的问题解决。 R的非线性优化程序是 optim() 和 nlm()。 二者分别替换 S-Plus 的 ms() 和 nlminb()。我们通过搜寻 参数值使得缺乏度(lack-of-fit)最低,如 nlm() 就是通过循环调试各种参数…

    2015-11-22
  • 用R语言进行数据分析:方差分析模型

    方差分析和模型比较 模型拟合函数 aov(formula, data=data.frame) 和函数 lm() 非常的相似,在Generic functions for extracting model information 部分列出的泛型函数同样适用。 需要注意的是 aov() 还允许分析 多方差层次的模型,如裂区实验设计, 利用区组内信息进行的平衡不完…

    2015-11-22
  • 用R语言进行数据分析:常规和广义线性模型

    线性模型 对于常规的多重模型(multiple model)拟合,最基本的函数是lm()。 下面是调用它的方式的一种改进版: > fitted.model <- lm(formula, data = data.frame) 例如 > fm2 <- lm(y ~ x1 + x2, data = production) 将会拟合 y 对 …

  • 用R语言进行数据分析:定义统计模型的公式

    下面的统计模型的模板是一个基于 独立的方差齐性数据的线性模型 y_i = sum_{j=0}^p beta_j x_{ij} + e_i, i = 1, …, n, 其中 e_i 属于 NID(0, sigma^2)。 用矩阵格式表示,它可以写为 y = X beta + e 其中 y 是响应向量,X 是模型 矩阵(model matrix)或者设计矩阵…

    2015-11-22
  • 用R语言进行数据分析:编写函数

    正如前面内容所暗示的一样,R 语言允许用户 创建自己的函数(function)对象。R 有一些 内部函数并且可以用在 其他的表达式中。通过这个过程,R 在程序的功能性, 便利性和优美性上得到了扩展。学写这些有用的函数 是一个人轻松地创造性地使用 R 的 最主要的方式。 需要强调的是,大多是函数都作为 R 系统的一部分提供,如mean(), var(), po…

    2015-11-22
  • 用R语言进行数据分析:循环和条件控制

    成组表达式 R 是一种表达式语言(expression language)因为它仅有的命令形式 是返回结果的函数和表达式。赋值操作实际上 也是一个表达式结果的再分配,并且可以用在 任何表达式中,甚至多重赋值 也是允许的。 命令可以用大括弧圈在一起 {expr_1; …; expr_m}。此时,这一组命令的结果 是该组中最后一个命令的值。既然一个组…

    2015-11-15
  • 用R语言进行数据分析:单样本和双样本检验

    到现在为止,我们已经学会了单样本的正态性检验。 而更常用的操作是比较两个样本的特征。在 R 里面,所有“传统”的检验都放在 包 stats 里面。这个包常常会自动载入。 下面是冰融化过程的潜热(latent heat)(cal/gm) 数据(来自 Rice (1995, p.490)) Method A: 79.98 80.04 80.02 80.04 80…

    2015-11-15
  • 用R语言进行数据分析:检验一个数据集的分布

    我们可以用很多方法分析一个单变量的数据集。 最简单的办法就是直接看数字。利用函数 summary 和 fivenum 会得到 两个稍稍有点差异的汇总信息。 此外,stem (“茎叶”图)也会反映整个数据集的数字信息的。 > attach(faithful) > summary(eruptions) Min. 1st Qu. Median Mean…

    2015-11-15
  • 用R语言进行数据分析:R的统计表

    R的统计表 R给出了详尽的统计表。R 还提供了相关函数来 计算累计概率分布函数 X <= x), 概率密度函数和分位数函数(给定 q,符合 P(X <= x) > q的最小x就是对应的分位数), 和基于概率分布的计算机模拟。 概率分布 R 对应的名字 附加参数 β分布 beta shape1, shape2, ncp 二项式分布 binom…

    2015-11-15
分享本页
返回顶部