0基础,如何快速入门数据分析?

0基础,如何快速入门数据分析。

根据以往的经验,很多人在学习数据分析的过程中会遇到下面这样的疑问:

–我是文科生出身,可以学习数据分析吗?

–我没有编程基础而且对编程无感,可以成为高级数据分析师吗?

–如何快速入门数据分析?

我是文科生出身,可以学习数据分析吗?

当然可以,数据分析的应用几乎是无行业和人群限制的。DT时代拼的是人才和创新价值的能力,拼的是你的数据能够给社会创造多少价值,用数据挣钱才是未来真正所在,运用数据的能力越来越成为基础的职业技能。因此任何有兴趣和需求的人士都可以进入这个领域,这也正是数据分析的魅力所在。

基础,如何快速入门数据分析?"

我没有编程基础而且对编程无感,可以成为高级数据分析师吗?

我们都知道,数据分析最重要的是商业的理解、分析的思路、分析的流程及结果的解读。编程则是实现这些分析思路的手段之一。然而,编程的训练不是短时间可以培养出来。因此,是否有可能在不编程的情况下,就能直接进入分析最重要的思路领域呢?是我今天想要和大家探讨的话题。当然这里并不是在比较各个软件的好坏,只是从知识和应用的角度来探讨非纯编程语言入门数据分析的路径:

第一阶段:Sql数据库语言

作为数据分析人员,我们首先要知道如何去获取数据,其中最常见的就是从关系型数据库中取数,因此你可以不会R,不会python,但是你不能不会SQL。

DT时代,数据正在呈指数级增长。Excel对十万条以内的数据处理起来没有问题,但是往小处说,但凡产品有一点规模,数据都是百万起。这时候就需要学习数据库。

在招聘条件中,越来越多的产品和运营岗位,将会SQL作为优先的加分项。SQL是数据分析的核心技能之一,从Excel到SQL是数据处理效率的一大进步。

主要了解数据库查询语言,where,group by,orderby,having,like,count,sum,min,max,distinct,if,join,left join,limit,and和or的逻辑,时间转换函数等。

学习SQL最快的方法是能自己下载数据库管理工具,找些数据练习。这里推荐MYSQL。

推荐数据:《MYSQL必知必会》

基础,如何快速入门数据分析?"

第二阶段:数据可视化

这几乎是你正式进行数据分析的第一步,通过SQL拿到数据之后,我们需要使用可视化方法探索和发现数据中的模式规律。

数据分析界有一句经典名言,字不如表,表不如图。实际上除掉数据挖掘这类高级分析,不少数据分析就是监控数据和观察数据。

除此此外,数据分析的大多时候都是要兜售自己的观点和结论的,而兜售的最好方式就是做出观点清晰数据详实的PPT和报表给老板看。

可视化的工具有很多,这里我推荐微软的power bi或者tableau。这两款都不要编程功底,实现起来简单,功能强大。下图是tableau工作的示例:(某产品销售额与利润分布-地图)

基础,如何快速入门数据分析?"

推荐书籍:《用图表说话》-麦肯锡

第三阶段:数理统计学

统计学是数据分析最重要的基础之一,是数据分析的基石和方法论。

统计知识会要求我们以另一个角度看待数据。当你知道AB两组的差异用平均值看是多傻的事情,你的分析技巧也会显著提高。

这里我们需要从基础的统计理论(描述性统计、区间估计、假设检验等)出发,到基本的统计分析(T 检验、方差分析等),最后到商业常用的模型(回归分析、方差分析等),学习数据分析背后的逻辑,掌握实用统计学的概念和会利用统计的思维去思考问题。

推荐书籍:

《从零进阶 数据分析的统计基础》-曹正凤

《统计学》-贾俊平

基础,如何快速入门数据分析?"

第四阶段:数据分析与软件应用

如果你想快速入门而又不想学习编程,我推荐使用SPSS。

SPSS软件是世界三大统计分析软件之一,以其易于操作、易于入门,结果易于阅读的优点,一直备受数据分析人员的青睐,一般经过短期学习即可用SPSS 做简单的数据分析,包括绘制图表、简单回归、相关分析等等。

学习SPSS的重点并不在于软件本身,而是相关的统计学知识,这也是在前面建议大家铺垫的,也就是你要学会怎样去分析“输入数据后,软件给你呈现的结果”。

推荐书籍:

《如虎添翼 数据处理的SPSS/SAS EG实现》-徐筱刚

《胸有成竹 数据分析的SPSS/SAS EG进阶》-常国珍

《SPSS统计分析基础教程+高级教程》-张文彤

第五阶段:数据挖掘与软件应用

数据挖掘,英文是DataMining 也叫作数据勘探,类似于采矿,但是数据是贫矿。我们需要结合行业课题,利用数据挖掘工具,建置数据挖掘模型,发掘规律和商业价值。另外数据挖掘是交叉学科,涉及统计学、计算机、机器学习、运筹学等多门学科,是一个运用广泛和富有前景的学科领域。

学习算法模型包括线性回归、逻辑回归、主成分分析、因子分析、聚类、关联规则、决策树、随机森林、支持向量机、贝叶斯、神经网络等。

工具上,对于非编程路径,我建议使用SPSS Modeler+Weka,这两套软件都不需要编程且各有其独特的优点能达到互补的效果。IBM SPSS Moderler提供了可视化的流程控制接口,其分析思路在这个接口上一览无遗。而Weka则提供了进阶数据挖掘的模型建置功能(例如深度学习),可强化IBM SPSSModerler在进阶数据挖掘上的不足。同时,Weka也是数据挖掘世界大赛中,经常被使用的软件,其进阶分析的能力极强。两者交互应用,各取所长,可以大幅提升分析的效率及准确度。

推荐书籍:《clementine数据挖掘方法及应用》

基础,如何快速入门数据分析?"

第六阶段:数据分析行业应用和数据分析思维

对于数据分析师来说,业务的了解比数据方法论更重要。当然很遗憾,业务学习没有捷径。

推荐书籍:

《增长黑客》

《精益数据分析》

以上就是数据分析师-非编程路线的进阶路线,如果你沿着此路线学习,相信你在数据分析道路上有所收获。

本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。

(2)
上一篇 2021-06-03 07:49
下一篇 2021-06-10 00:59

相关文章

关注我们
关注我们
分享本页
返回顶部