数仓概念: 目的:面向分析,支持分析
数据仓库(英语:Data Warehouse,简称数仓、DW),是一个用于存储、分析、报告的数据系统。
数据仓库的目的是构建面向分析的集成化数据环境,分析结果为企业提供决策支持(Decision Support)。
数仓专注分析:
数据仓库
本身并不“生产”任何数据
,其数据来源于不同外部系统;
同时数据仓库自身
也不需要“消费”任何的数据
,其结果开放给各个外部应用使用
为什么会出现数仓:
1、解决业务数据的存储问题
2、分析型决策的制定
数据仓库的构建:
如数仓定义所说,
数仓是一个用于存储、分析、报告的数据系统
,目的是
构建面向分析的集成化数据环境
。我们把
这种
面向分析、支持分析的系统称之为
OLAP
(联机分析处理)系统
。当然,数据仓库是OLAP系统的一种实现。
数仓主要特征:
面向主题性:
传统OLTP系统对数据的划分并不适用于决策分析。而基于主题组织的数据则不同,它们被划分为各自独立的领域 ,每个领域有各自的逻辑内涵但互不交叉,在
抽象层次上对数据进行完整、一致和准确的描述
。
集成性:
统一源数据中所有矛盾之处
;
进行
数据综合和计算
。
数据仓库中的数据综合工作可以在从原有数据库抽取数据时生成,但许多是在数据仓库内部生成的,即进入数据仓库以后进行综合生成的。
非易失性、非异变性:
数据仓库是分析数据的平台,而不是创造数据的平台
。我们是通过数仓去分析数据中的规律,而不是去创造修改其中的规律。因此数据进入数据仓库后,它便稳定且不会改变
数据仓库的数据反映的是一段相当长的时间内历史数据的内容
数据仓库中一般有
大量的查询操作
,但修改和删除操作很少
。
时变性: 数仓是一个项目,更是一个过程
当业务变化后会失去时效性。因此
数据仓库的数据需要随着时间更新,以适应决策的需要
数据仓库主流开发语言--SQL:
结构化查询语言
(
S
tructured
Q
uery
L
anguage)简称
SQL
,是一种数据库查询和程序设计语言,用于
存取数据
以及
查询
、
更新
和
管理
数据
特点:功能强大、简洁、语法简单、易于学习
sql基本语法:
DDL语法使我们有能力
创建或删除表
,以及数据库、索引等各种对象,但是不涉及表中具体数据操作:
CREATE
DATAbase - 创建新数据库
CREATE TABLE - 创建新表
DML语法是我们有能力针对
表中的数据进行插入、更新、删除、查询
操作:
SELECT
- 从数据库表中获取数据
UPDATE
- 更新数据库表中的数据
DELETE
- 从数据库表中删除数据
INSERT
- 向数据库表中插入数据
更多sql语法详情可看本人其他系列(mysql学习,
更新中
)