用SAS进行数据分析:使用Array填补缺失值

在做数据分析、建模之前,数据处理过程中都会碰到的一个问题,就是对缺失值的处理,有时候我们不可能都把缺失值给丢掉,可能通过填补的方式尽可能的补充基础数据,常用的方式有用均值填补、用中间值填补、用众数填补、用回归模型预测填补等等。

下面介绍SAS中利用Array进行简单的缺失值填补
其中分为对数值型和字符型的缺失值进行赋值
全部都放在macro里面好了
代码示例如下所示:
%macro missing(data);
data &data;
set &data;
array TEMP _numeric_;
 do over TEMP;
 if missing(TEMP) then TEMP=0;
 end;
run;
data &data;
set &data;
array TEMP _character_;
 do over TEMP;
 if missing(TEMP) then TEMP=0;
 end;
run;
%mend;
 编译的宏代码调用
%missing(数据集);
这样就可以把数据集中的字符型、数值型的缺失值进行填补
作者:郑来轶
数据分析精选专稿,转载必须获得本站、原作者的同意,拒绝任何不表明作者及来源链接的转载!
郑来轶

郑来轶

人称“数据哥”,微博/微信/今日头条/百度百家/一点资讯/网易云阅读等大V帐号@数据分析精选,国内某知名互联网公司无线数据分析专家,前中国移动阅读基地资深数据分析师、每日轩昂BI总监,多年来深耕移动互联网行业的数据体系建设与数据分析应用。
郑来轶

注:数据分析网遵循行业规范,任何转载的稿件都会明确标注作者和来源,若标注有误或遗漏,请联系主编邮箱:afenxi@afenxi.com

分享到:更多

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址