SAS学习途径与相关资源 – SAS商业分析

SAS可能是分析行业最常用的工具了。与其他工具比如R和Python相比,尽管有人可能对它的可持续性以及特征有着不同的想法,但是有两点是可以肯定的。那就是:

  • 健康的市场份额 – SAS仍然占据着最大的市场份额。哪怕是在像美国和英国这样的高级市场,它的市场份额至少有40%。而像印度这样的国家,它的市场份额会超过70%。
  • 便于学习并且有着超棒的(资源)支持 – 在我所知道的工具中,SAS有资格被认为是最简单易学的。语言简单到连新手都能快速入门。

这两个理由足够让刚刚进入这个行业的新手考虑学习SAS。点击这个链接,http://www.analyticsvidhya.com/blog/2014/03/sas-vs-vs-python-tool-learn/ 你可以找到更多相关细节。

首先,为什么要学习SAS?

点击此链接,https://www.youtube.com/watch?v=ksp8CzIgb-E,有一个小视频可以让你了解一下学习SAS的用途。

第一步:下载并安装SAS软件

可以通过创建一个SAS文件来下载学校版本。你也需要下载VMWare或者Oracle 视图工具箱。学校版本链接如下:http://www.sas.com/en_us/software/university-edition.html

安装提示:

  • SAS学校版本目前只支持windows 64bit系统
  • 你需要先下载VMWare播放器或者Oracle视图工具箱,然后下载相应的SAS大学版本。

第二步:学习基本SAS

在sad.com有免费的基础SAS培训,通过这个培训你可以在24小时内学习到SAS的基础知识。

第三步:学习SQL

现在你在一定程度上了解了SAS基础知识,现在你应该看一下另一种在SAS上处理数据的方式- PROC SQL。阅读这篇文章可以帮助你理解PROC SQL如何用于处理数据。(Proc SQL和Data Step之间的比较)

如果你已经知道了SQL,你会感激SAS创建了PROC SQL。即使你不知道SQL,你可能也会觉得在SAS上进行日常数据管理工作很简单。这篇SUGI文章也可以看一看:PROC SQL入门。如果你需要更细致的教程,可以看看这个学习工具:http://www.sys-seminar.com/EE/Files/AdvancedSubqueriesinPROCSQL.pdf

第四步:学习描述统计学

现在让我们开始统计学的学习。现在可以开始学习描述统计学的课程了(链接https://www.udacity.com/course/ud827)。这门课程用Excel来教你所以描述统计学的基础知识。如果你已经知道这些知识,可以直接略过这一步。

课程任务:在Udacity课程的每个章节后面的习题应该在SAS上完成。从基础SAS课程学到的知识应该足够让你完成这些习题。如果你需要具体的帮助,可以使用SAS文档。

第五步:学习推理统计学

这个链接是学习推理统计学的课程(https://www.udacity.com/course/ud201)。这个课程使用Excel表格教你所有关于推理统计学,假设性检测,T-检测以及ANOVA的相关知识。如果你已经学过这些知识,可以直接略过这一步。

课程任务:在Udacity课程的每个章节后面的习题应该在Excel上完成。在下一步完成后,我们将重新温习一下SAS课程。

第六步:在SAS学习ANOVA,线性回归和逻辑回归分析

sas.com上有相关培训内容(链接:https://support.sas.com/edu/schedules.html?id=1979&ctry=US)

课程任务:课程里以及Udacity课程里都有有相关习题

如果你使用的是SAS大学版本,你需要略过步骤7.9和10。 SAS大学版本有版本限制,不能运行决策树和时间序列建模。

第七步:学习决策树

既然你知道了一些算法,那就让我们看看决策树。这里有两篇解释决策树运行的相关文章:

  1. 决策树 – 简化版本http://www.analyticsvidhya.com/blog/2015/01/decision-tree-simplified/
  2. 决策树算法 – 简化版本http://www.analyticsvidhya.com/blog/?p=12419&preview=true

这里有一份指导如何在Enterprise Miner上运行决策树的指南 http://www.iasri.res.in/sscnars/data_mining/3-Building%20Decision%20Trees%20using%20SAS.pdf

这个是一篇关于在基础SAS上执行决策树的文章http://support.sas.com/resources/papers/proceedings10/094-2010.pdf

第八步:分类归并与分段

首先,先看看播放列表中前四个介绍K-平均值分类归并的视频https://www.youtube.com/watch?v=aiJ8II94qck&list=PLQbGGI2mvVjPPvWgs4hCR5FkXykzAu69S。然后读一下从SAS上分类归并的指南 http://support.sas.com/documentation/cdl/en/statugclustering/61759/PDF/default/statugclustering.pdf。此外,你可以在这个章节查询相关内容 http://www.math.wpi.edu/saspdf/stat/chap23.pdf

第九步:学习时间序列预测

这个链接是学习时间序列预测的入门教程。你可以使用这个教程来使用SAS里的时间序列来预测。

第十步:学习IML

以下三个链接是一系列的文章。你可以通过这些文章快速了解IML:

  1. SAS IML介绍http://www.analyticsvidhya.com/blog/2014/10/proc-iml-matrix-handling-sas/
  2. PROC IML世界的将来发展http://www.analyticsvidhya.com/blog/2014/11/step-world-sas-iml/
  3. PROC IML在分析中的应用 http://www.analyticsvidhya.com/blog/2014/11/applications-sas-iml-analytics/

第十一步:学习SAS Macros

下面三个链接是一系列帮助你理解SAS Macros的文章。

  1. SAL Macro入门介绍
  2. SAS Macro条件语句和迭代语句
  3. SAS Macro功能介绍

其他关于SAS的有用资源:

  1. SAS小手册
  2. ATS UCLA的学习之路
  3. 数据分析例子 – SAS具体话题实例

——本文由数据分析网翻译组- 纪旭翻译

注:数据分析网遵循行业规范,任何转载的稿件都会明确标注作者和来源,若标注有误或遗漏,请联系主编邮箱:afenxi@afenxi.com

selina
认证作者

数据分析网翻译组成员纪旭,4年以上海外留学及工作经历,爱尔兰都柏林大学生物技术与商科硕士,现任职于Corlytics Ltd,参与金融合规案例分析工作,曾任职于药明康德,有一年以上项目管理、商业运营经验。

分享到:更多

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址