我们现在生活在一个由数据驱动的世界中,每天都在收集和存储大量信息。组织生成的数据越多,有效访问和分析数据的能力就越重要。
不幸的是,数据分析被认为是当今许多公司的薄弱环节。这主要是因为在执行无效分析时选择了错误类型的数据存储系统。
改进分析的一种方法是购买企业级数据仓库。这就是数据仓库中 OLAP 的用武之地。
什么是OLAP?在线分析处理,简称OLAP,是一种允许用户有选择地获取和查询信息以从不同角度进行研究的计算方法。OLAP BI(商业智能)查询通常有助于分析趋势、财务报告、销售预测和其他计划活动。
例如,用户可以通过显示电子表格来请求数据分析,该电子表格显示上个月在加利福尼亚销售的所有 2020 轿车。然后,他们可以将当月的收入数字与类似产品进行比较,然后查看该州同期其他汽车销量的比较。
OLAP 系统如何工作?
为了便于数据分析,OLAP 系统从多个来源收集信息并将其存储在数据仓库中。然后它清理数据并将其组织成数据立方体。
这些 OLAP 多维数据集中的每一个都包含按维度分类的数据,例如地理销售区域、客户和时间段。这些维度随后填充有客户姓名和国家/地区等详细信息,并根据层次结构进行组织。
执行完所有这些操作后,数据分析师就可以执行四种类型的 OLAP 分析操作:
- 上卷:也称为合并或聚合,它是一种可以通过两种方式执行的操作:通过减少维度或通过爬升概念层次结构。
- 下钻:下钻方法与上卷过程相反,它涉及将信息分成更小的部分。
- 切片和骰子:在切片中,分析师可以采用单一级别的信息进行显示。在骰子中,分析师可以从多个维度中选择数据进行评估。
- 枢轴:在枢轴中,分析师旋转数据轴以获取有关正在研究的信息的新观点。
2021-2022年软件开发及QA测试报告
OLAP 系统的类型
OLAP 层次结构以 OLAP 开头,然后是其他三种类型。它们是 ROLAP、MOLAP 和 HOLAP。
- ROLAP
关系 OLAP (ROLAP) 是一种扩展的 RDBMS,它处理可以在关系数据库中找到的信息。所有的事实和维度表都保留为关系表,同时还允许进行多维数据分析。
ROLAP 的两个主要优点是处理大数据的效率很高,并且可以处理大量信息,因此具有 可扩展性。它的主要缺点是它需要更多的资源来执行,并且这个 OLAP 系统的查询性能比其他系统慢。
- MOLAP
多维 OLAP,或简称 MOLAP,是一种经典的 OLAP 方法,它利用多维数据立方体来促进数据分析。使用 MOLAP,用户可以针对不同方面的数据查看多个视图。
MOLAP 的主要优势在于其快速的查询性能、较小的数据量以及自动计算更高级别数据的能力。至于它的缺点,与 ROLAP 相比,它的可扩展性较差,并且该方法本身以引入数据冗余而闻名。
- HOLAP
Hybrid OLAP (HOLAP) 是 ROLAP 和 MOLAP 技术的组合。它允许快速计算 MOLAP,同时结合 ROLAP 的高可扩展性。
使用 HOLAP 的主要好处是它有助于提高磁盘空间经济性,同时利用多维数据集技术促进所有数据类型的更快性能。HOLAP 的主要缺点是它是使用起来最复杂的类型,因为它同时支持 ROLAP 和 MOLAP。
如何在数据仓库中使用OLAP进行多维分析
数据仓库是从一个或多个来源获得的公司信息的数据库。它不应该与 OLAP 混淆,因为两者不同。数据仓库是一个档案,而 OLAP 是分析和评估其存储信息的技术之一。
在数据仓库中,OLAP 允许从不同角度快速查询和分析数据。它还有助于预先汇总和预先计算存档中可用的信息。
OLAP 提供的最大好处是它在数据组织和分析方面的多维方法。使用 OLAP,公司可以将其数据集分解为更易于研究的维度。
OLTP 与 OLAP
OLAP 代表在线分析处理,与 OLTP 不同。
联机事务处理 (OLTP) 能够通过遵循三层体系结构来支持面向事务的应用程序。OLTP 最常见的用途是管理组织内发生的日常事务,其主要目标是数据处理。
运行中的 OLTP 系统的一个例子是 ATM 中心。假设我们有一对夫妇在他们的银行使用联名账户。有一天,两人决定在完全相同的时间但在不同的 ATM 机上提取他们账户中的总金额。
两者中谁先完成身份验证过程,将获得他们想要的钱。在这种情况下,OLTP 系统确保提取的金额不超过银行中的当前金额。
当今使用的 OLTP 系统的其他一些示例可以在以下位置找到:
- 网上银行业务
- 订单条目
- 将商品添加到购物车
- 发送短信
- 在线预订机票
这里的关键是 OLTP 系统是为事务优势而设计的,而不是为数据分析而设计的。
为了更好地理解 OLTP 与 OLAP 之间的区别,让我们看一下下表。
| 参数 | OLTP | OLAP |
|---|---|---|
| 过程 | OLTP 是一个处理数据库修改的在线事务系统。 | OLAP 侧重于在线分析和数据检索。 |
| 功能 | OLTP 用作修改数据的在线数据库。 | OLAP 用作数据库查询管理系统。 |
| 询问 | OLTP 从存档中插入、更新和删除数据。 | OLAP 主要做选择操作。 |
| 来源 | OLTP 中的数据源是发生的事务。 | 不同的 OLTP 数据库是 OLAP 的数据源。 |
| 数据的完整性 | OLTP 数据库必须维护数据完整性约束。 | 数据完整性不是 OLAP 数据库的问题。 |
| 响应时间 | OLTP 响应时间为毫秒。 | OLAP 的响应时间是几秒到几分钟。 |
| 备份 | OLTP 具有完整的数据备份和增量备份。 | OLAP 只需要不时执行备份。 |
| 目的 | OLTP 用于处理实时业务操作。 | OLAP 旨在分析业务度量。 |
| 性能指标 | 性能指标是事务吞吐量。 | 性能指标是查询吞吐量。 |
| 生产率 | OLTP 有助于改善用户的自助服务和整体生产力。 | OLAP 提高了组织分析师的工作效率。 |
OLAP 在满足组织的分析需求方面起着至关重要的作用。以下是OLAP在各个领域的用例。
- 营销:在营销中使用 OLAP 时,营销分析师可以更多地了解他们的客户、哪些产品是有价值的、区域和季节性趋势等。
- 医疗保健:使用 OLAP 的医疗保健数据仓库可用于预测健康风险和结果,与保险公司共享信息并生成报告。
- 金融服务:公司 CFO 可以利用 OLAP 多维数据集为他们提供将数据转换为所需信息的方法,同时还允许他们轻松生成定制的财务报告。
OLAP 的优势
这些是在数据仓库中使用 OLAP 的好处:
- 数据处理速度快: OLAP 以查询执行速度快而著称。设计良好的数据立方体通常可以在几秒钟内处理用户查询。
- 多维数据表示:这种能力允许用户从不同的观点或切片查看数据。
- 平坦的学习曲线: OLAP 供应商经常为他们的客户提供大量的教程和文档。他们通常还拥有一支专业团队,随时准备处理可能出现的任何问题。
- 聚合且详细的数据: OLAP 的另一个主要优点是呈现给用户的信息是聚合的且非常详细。这意味着表格以多个维度进行组织,使任何人都可以轻松浏览大量数据。
结论
如您所见,OLAP 在数据仓库中扮演着重要的角色,因为它可以帮助确保提供给用户的数据得到快速处理、从多个角度可用并且详细说明。除此之外,它还具有平坦的学习曲线,因为大多数提供商都提供有关如何入门的深入教程。



