栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

python+大数据开发培训(python+大数据课程理念)

python+大数据开发培训(python+大数据课程理念)

数仓概念:    目的:面向分析,支持分析 数据仓库(英语:Data Warehouse,简称数仓、DW),是一个用于存储、分析、报告的数据系统。 数据仓库的目的是构建面向分析的集成化数据环境,分析结果为企业提供决策支持(Decision Support)。 数仓专注分析: 数据仓库 本身并不“生产”任何数据 ,其数据来源于不同外部系统; 同时数据仓库自身 也不需要“消费”任何的数据 ,其结果开放给各个外部应用使用 为什么会出现数仓: 1、解决业务数据的存储问题 2、分析型决策的制定 数据仓库的构建: 如数仓定义所说, 数仓是一个用于存储、分析、报告的数据系统 ,目的是 构建面向分析的集成化数据环境 。我们把 这种 面向分析、支持分析的系统称之为 OLAP (联机分析处理)系统 。当然,数据仓库是OLAP系统的一种实现。 数仓主要特征: 面向主题性: 传统OLTP系统对数据的划分并不适用于决策分析。而基于主题组织的数据则不同,它们被划分为各自独立的领域 ,每个领域有各自的逻辑内涵但互不交叉,在 抽象层次上对数据进行完整、一致和准确的描述 。 集成性: 统一源数据中所有矛盾之处 ; 进行 数据综合和计算 。 数据仓库中的数据综合工作可以在从原有数据库抽取数据时生成,但许多是在数据仓库内部生成的,即进入数据仓库以后进行综合生成的。 非易失性、非异变性: 数据仓库是分析数据的平台,而不是创造数据的平台 。我们是通过数仓去分析数据中的规律,而不是去创造修改其中的规律。因此数据进入数据仓库后,它便稳定且不会改变 数据仓库的数据反映的是一段相当长的时间内历史数据的内容 数据仓库中一般有 大量的查询操作 ,但修改和删除操作很少 。 时变性:   数仓是一个项目,更是一个过程 当业务变化后会失去时效性。因此 数据仓库的数据需要随着时间更新,以适应决策的需要 数据仓库主流开发语言--SQL: 结构化查询语言 ( S tructured Q uery L anguage)简称 SQL ,是一种数据库查询和程序设计语言,用于 存取数据 以及 查询 、 更新 和 管理 数据 特点:功能强大、简洁、语法简单、易于学习 sql基本语法: DDL语法使我们有能力 创建或删除表 ,以及数据库、索引等各种对象,但是不涉及表中具体数据操作: CREATE DATAbase - 创建新数据库 CREATE TABLE - 创建新表 DML语法是我们有能力针对 表中的数据进行插入、更新、删除、查询 操作: SELECT - 从数据库表中获取数据 UPDATE - 更新数据库表中的数据 DELETE - 从数据库表中删除数据 INSERT - 向数据库表中插入数据 更多sql语法详情可看本人其他系列(mysql学习, 更新中 )
转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/772085.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号