从字面上理解,说白了就是把数据存在一个地方,类似于现实生活中的仓库,之所以叫数据仓库,也是由于它的一些特性
数据仓库的作用,可以分为以下几点:
-
存储:数据仓库将接收和存储来自多个数据源的数据。
-
处理:ETL。
-
访问:为企业的分析和决策提供支持。
数据仓库的特点:
- 面向主题,基本的主题比如销量、用户。而普通数据库一般面向事务,比如用户下订单、用户注册登录
- 数据仓库是集成的,数据来源于分散的操作型数据,将数据进行ETL之后才能进入数据仓库
- 别人是怎么建数仓的
- 为什么这样建设数仓,为什么这样定义数仓的层级
- 数仓的理论知识由浅入深有哪些
从零开始建设一个数仓,并为企业带来收益
应该从哪些资料中学习 ?书:《阿里巴巴大数据建设指南》
网站:正在收集
具体要学些什么,学习的顺序?- 为什么要建设数仓?
- 数仓的基础理论
- 模型的层次结构,为什么要建这一层?每一层的作用
- 维度建模
- 事实表设计
- 元数据
- 数据质量
- 数据应用
可以用网上找到的数仓建设指南,最好寻找类似工作中使用的数仓,结合自己在工作中的理解,缩小学习资料的范围



