郑来轶
郑来轶 认证作者

主页: http://blog.sina.com.cn/zhenglaiyi

简介:人称“数据哥”,微博/微信/今日头条/百度百家/一点资讯/网易云阅读等大V帐号@数据分析精选,国内某知名互联网公司无线数据分析专家,前中国移动阅读基地资深数据分析师、每日轩昂BI总监,多年来深耕移动互联网行业的数据体系建设与数据分析应用。

用SAS进行数据分析:使用Array填补缺失值-数据分析网
SAS

用SAS进行数据分析:使用Array填补缺失值

郑来轶

在做数据分析、建模之前,数据处理过程中都会碰到的一个问题,就是对缺失值的处理,有时候我们不可能都把缺失值给丢掉,可能通过填补的方式尽可能的补充基础数据,常用的方式有用均值填补、用中间值填补、用众数填补、用回归模型预测填补等等。 下面介绍SA...

用SAS进行数据分析:如何进行随机抽样?-数据分析网
SAS

用SAS进行数据分析:如何进行随机抽样?

郑来轶

利用SAS进行随机抽样 在构建数据挖掘模型过程中,有时我们无法对所有的整体进行全面研究,有时我们希望将整体划分为训练集、验证集、测试集三份用于不同目的的数据集,甚至在K-折交叉验证中,我们需要把样本随机的划分为K份数据子集。本文介绍SAS的...

Excel2013中如何实现多级联动下拉菜单-数据分析网
Excel

Excel2013中如何实现多级联动下拉菜单

郑来轶

你一级菜单选择了某个省份,二级菜单联动可以选择省份对应的城市。实现这个效果的原理,实际上是对不同的列设置了名称,而名称恰好对应是上一级菜单里面的选择项,在数据有效性中函数读取的其实引用这个名称所对应的内容,这样也就把下一级的菜单内容读取出来...

在Excel中使用SQL语句实现精确查询-数据分析网
Excel

在Excel中使用SQL语句实现精确查询

郑来轶

之前在微博上通过@数据分析精选 分享的一篇文章,是关于《在Excel中使用SQL语句实现精确查询》,觉得非常受用,再次在博客分享给大家。 微博上有人回复评论说直接用vlookup、或者导入数据库进行查询处理就好了,岂不是更高效、更灵活;其实...

从阿里巴巴笔试试题看数据分析师的职业要求-数据分析网
数据分析

从阿里巴巴笔试试题看数据分析师的职业要求

郑来轶

以下试题是来自阿里巴巴2011年招募实习生的一次笔试题,从笔试题的几个要求我们一起来看看数据分析的职业要求。 一、异常值是指什么?请列举1种识别连续型变量异常值的方法? 异常值(Outlier) 是指样本中的个别值,其数值明显偏离所属样本的...

用SAS进行数据分析:连接ORACLE数据库-数据分析网
SAS

用SAS进行数据分析:连接ORACLE数据库

郑来轶

之前写过一篇通过odbc配置之后创建逻辑库链接到oracle数据库的博文 其实可以不配置odbc也可以 下面图文介绍一下 第一步,安装Oracle客户端 第二步,找到tnsnames.ora文件,默认Oracle\ora90\network...

用Excel进行数据分析:如何进行抽样?-数据分析网
Excel

用Excel进行数据分析:如何进行抽样?

郑来轶

做数据分析、市场研究、产品质量检测,不可能像人口普查那样,进行全量的进行研究,这就需要用到抽样分析技术。什么是抽样呢?就是从总体中抽取一部分样本进行研究分析,用来估计和推断总体的情况,是数据分析里面很基础的一个统计方法,抽样有简单随机、系统...

用Excel进行数据分析:回归分析-数据分析网
Excel

用Excel进行数据分析:回归分析

郑来轶

在日常数据分析工作当中,回归分析是应用十分广泛的一种数据分析方法,按照涉及自变量的多少,可分为一元回归分析和多元回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。 回归分析的实施步骤: 1)根据预测目标,确定自...

教你怎么看聚类分析的树状图-数据分析网
数据分析

教你怎么看聚类分析的树状图

郑来轶

之前有群友问,用聚类分析得到的树状图,怎么看? 简单讲一下: 有下面这样的一个树状图 现在我们开始切了 从右往左看,开始出现了2条横线,在此竖着切一刀,每一条线的左侧为1类 这样我们把样本划分为2类 第一类:中国 第二类:其他国家或者地区 ...

用Excel进行数据分析:制作直方图-数据分析网
Excel

用Excel进行数据分析:制作直方图

郑来轶

在数据分析的时候,经常需要对连续性变量数据进行分段分布展现,当然可以通过分段然后进行分类汇总、数据透视表、或者直接数据库中统计完成,然后制作柱形图(非直方图,分类分开的)并设置,在数据量不是很大的情况下,在Excel里面利用数据分析功能制作...

用Excel进行数据分析:计算相关系数-数据分析网
Excel

用Excel进行数据分析:计算相关系数

郑来轶

什么是相关系数?或称线性相关系数、皮氏积矩相关系数(Pearson product-moment correlation coefficient, PPCC)等,是衡量两个随机变量之间线性相关程度的指标。它由卡尔·皮尔森(Karl Pear...

用Excel进行数据分析:计算移动平均-数据分析网
Excel

用Excel进行数据分析:计算移动平均

郑来轶

移动平均法是一种简单平滑预测技术,它的基本思想是:根据时间序列资料、逐项推移,依次计算包含一定项数的序时平均值,以反映长期趋势的方法。使用此工具可以预测销售量、库存或其他趋势。预测值的计算公式如下: 式中: N为进行移动平均计算的过去期间的...

用Excel进行数据分析:描述性统计分析-数据分析网
Excel

用Excel进行数据分析:描述性统计分析

郑来轶

在数据分析的时候,一般首先要对数据进行描述性统计分析(Descriptive Analysis),以发现其内在的规律,再选择进一步分析的方法。描述性统计分析要对调查总体所有变量的有关数据做统计性描述,主要包括数据的频数分析、数据的集中趋势分...