在做数据分析、建模之前,数据处理过程中都会碰到的一个问题,就是对缺失值的处理,有时候我们不可能都把缺失值给丢掉,可能通过填补的方式尽可能的补充基础数据,常用的方式有用均值填补、用中间值填补、用众数填补…
  • 专栏
  • SAS
  • 2015-11-03
用SAS绘制累积柱状图并添加折线 PS:直接上代码,对SAS CODE不熟悉的可以绕行。 GOPTIONS RESET=ALL BORDER CBACK=WHITE HTITLE=12PT; DATA…
  • 专栏
  • SAS
  • 2015-11-03
60天入门数据分析师
利用SAS进行随机抽样 在构建数据挖掘模型过程中,有时我们无法对所有的整体进行全面研究,有时我们希望将整体划分为训练集、验证集、测试集三份用于不同目的的数据集,甚至在K-折交叉验证中,我们需要把样本随…
  • 专栏
  • SAS
  • 2015-11-03
用SAS进行数据分析:报表与图形输出过程汇总 *Tabulate过程分类汇总; proc tabulate data=need;  class brand;  var ts9 ts10;  table…
  • 专栏
  • SAS
  • 2015-11-03
你一级菜单选择了某个省份,二级菜单联动可以选择省份对应的城市。实现这个效果的原理,实际上是对不同的列设置了名称,而名称恰好对应是上一级菜单里面的选择项,在数据有效性中函数读取的其实引用这个名称所对应的…
  • 专栏
  • Excel
  • 2015-11-03
[email protected] 分享的一篇文章,是关于《在Excel中使用SQL语句实现精确查询》,觉得非常受用,再次在博客分享给大家。 微博上有人回复评论说直接用vlookup、或者导入数据库进行查…
  • 专栏
  • Excel
  • 2015-11-01
以下试题是来自阿里巴巴2011年招募实习生的一次笔试题,从笔试题的几个要求我们一起来看看数据分析的职业要求。 一、异常值是指什么?请列举1种识别连续型变量异常值的方法? 异常值(Outlier) 是指…
之前写过一篇通过odbc配置之后创建逻辑库链接到oracle数据库的博文 其实可以不配置odbc也可以 下面图文介绍一下 第一步,安装Oracle客户端 第二步,找到tnsnames.ora文件,默认…
  • 专栏
  • SAS
  • 2015-11-01
做数据分析、市场研究、产品质量检测,不可能像人口普查那样,进行全量的进行研究,这就需要用到抽样分析技术。什么是抽样呢?就是从总体中抽取一部分样本进行研究分析,用来估计和推断总体的情况,是数据分析里面很…
  • 专栏
  • Excel
  • 2015-11-01
在日常数据分析工作当中,回归分析是应用十分广泛的一种数据分析方法,按照涉及自变量的多少,可分为一元回归分析和多元回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。 回归分…
  • 专栏
  • Excel
  • 2015-11-01
之前有群友问,用聚类分析得到的树状图,怎么看? 简单讲一下: 有下面这样的一个树状图 现在我们开始切了 从右往左看,开始出现了2条横线,在此竖着切一刀,每一条线的左侧为1类 这样我们把样本划分为2类 …
在数据分析的时候,经常需要对连续性变量数据进行分段分布展现,当然可以通过分段然后进行分类汇总、数据透视表、或者直接数据库中统计完成,然后制作柱形图(非直方图,分类分开的)并设置,在数据量不是很大的情况…
  • 专栏
  • Excel
  • 2015-11-01
什么是相关系数?或称线性相关系数、皮氏积矩相关系数(Pearson product-moment correlation coefficient, PPCC)等,是衡量两个随机变量之间线性相关程度的指…
  • 专栏
  • Excel
  • 2015-11-01
移动平均法是一种简单平滑预测技术,它的基本思想是:根据时间序列资料、逐项推移,依次计算包含一定项数的序时平均值,以反映长期趋势的方法。使用此工具可以预测销售量、库存或其他趋势。预测值的计算公式如下: …
  • 专栏
  • Excel
  • 2015-11-01

关注我们的公众号

微信公众号