数据仓库是什么、有哪些相关知识及常见认识误区?

数据分析师必备的数据仓库相关知识及常见认识误区。

3C用品, TECHNIC, 中央 的 免费素材图片

一、数据仓库是什么?

数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。它是单个数据存储,出于分析性报告和决策支持目的而创建。 为需要业务智能的企业,提供指导业务流程改进、监视时间、成本、质量以及控制。

二、数据仓库有哪些特点?

1、效率高

数据仓库的分析数据一般分为日、周、月、季、年等,可以看出,日为周期的数据要求的效率最高,要求24小时甚至12小时内,客户能看到昨天的数据分析

2、扩展性

之所以有的大型数据仓库系统架构设计复杂,是因为考虑到了未来3-5年的扩展性,这样的话,未来不用太快花钱去重建数据仓库系统,就能很稳定运行。主要体现在数据建模的合理性,数据仓库方案中多出一些中间层,使海量数据流有足够的缓冲,不至于数据量大很多,就运行不起来了。

3、面向主题

操作型数据库的数据组织面向事务处理任务,各个业务系统之间各自分离,而数据仓库中的数据是按照一定的主题域进行组织的。主题是与传统数据库的面向应用相对应的,是一个抽象概念,是在较高层次上将企业信息系统中的数据综合、归类并进行分析利用的抽象。每一个主题对应一个宏观的分析领域。数据仓库排除对于决策无用的数据,提供特定主题的简明视图。

4、集成性

面向事务处理的操作型数据库通常与某些特定的应用相关,数据库之间相互独立,并且往往是异构的。而数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上经过系统加工、汇总和整理得到的,必须消除源数据中的不一致性,以保证数据仓库内的信息是关于整个企业的一致的全局信息。

5、反映变化

操作型数据库主要关心当前某一个时间段内的数据,而数据仓库中的数据通常包含历史信息,系统记录了企业从过去某一时点(如开始应用数据仓库的时点)到目前的各个阶段的信息,通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测。

三、数据仓库的一些常见认识误区

1、数据仓库的建设是一次性工程。数据仓库实际上需要每年、每月、每周甚至每日都要进行更新,不是说一次性录入了历史的数据就可以完成的工作。

2、数据仓库是一个很大的仓库。其实衡量一个数据仓库的质量如何,并不是用数据量来衡量的,有一些优质的数据仓库项目,数据量并不是很大。

3、只要数据仓库建立和使用了,问题就解决了。

4、聚焦于内部的档案型数据,而忽视了外部数据以及图象、音频和视频文件的潜在价值。

5、数据仓库是将所有的业务数据存在一起的。数据仓库的一个目标是将分散的业务整合在一起的,但它往往是有目的地按分析需去实施的,并不是将全部的业务数据统统都集成在一起。

本文由 Smartbi 投稿至 数据分析网 并经编辑发表,内容观点不代表本站立场,如转载请联系原作者,本文链接:https://www.afenxi.com/93603.html 。

(0)
上一篇 2021-06-09 01:28
下一篇 2021-06-10 08:22

相关文章

关注我们
关注我们
分享本页
返回顶部