栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

数据分析——起源

数据分析——起源

数据分析生命周期:

从数据到决策的过程。

1.询问:业务挑战、目标、问题

2.准备:数据生成、收集、存储、管理

3.处理:数据清洗、数据完整性

4.分析:数据探索、可视化和分析

5.分享:交流和解释结果

6.行动:将见解付诸实践以解决问题

EMC的数据分析生命周期:

EMC Corporation 的数据分析生命周期是循环的,分为六个步骤:

1.发现数据

2.预处理数据

3.模型规划

4.建筑模型

5.交流结果

6.行动

EMC Corporation 现在更名为 Dell EMC。这个模型由 David Dietrich 创建,反映了现实世界项目的周期性。这些阶段不是静态的里程碑;每一步都连接并通向下一步,并最终重复。关键问题可帮助分析师测试他们是否已取得足够的成就以继续前进,并确保团队在每个阶段都花费了足够的时间,并且在数据准备好之前不要开始建模。它与这个程序所基于的数据分析生命周期略有不同,但它有一些共同的核心思想:第一阶段是对发现和提出问题感兴趣;必须先准备好数据,然后才能对其进行分析和使用;然后应该分享调查结果并采取行动。

SAS的迭代生命周期:

迭代生命周期由一家名为SAS的公司创建,该公司是领先的数据分析解决方案提供商。它可用于产生可重复、可靠和可预测的结果:

1.询问

2.准备

3.探索

4.建模

5.行动

6.事实

7.评估

SAS 模型通过将其可视化为无穷大符号来强调其模型的周期性。它们的生命周期有七个步骤,我们在其他模型中看到了其中的许多步骤,例如 Ask、Prepare、Model 和 Act。但是这个生命周期也有点不同;它包括行动阶段之后的一个步骤,旨在帮助分析师评估他们的解决方案并可能再次返回询问阶段。 

基于项目的数据分析生命周期:

1.识别问题

2.设计数据需求

3.预处理数据

4.执行数据分析

5.可视化数据

此数据分析项目生命周期由 Vignesh Prajapati 开发。它不包括第六阶段,或者我们所说的行动阶段。但是,它仍然涵盖了许多与我们已经描述的生命周期相同的步骤。它从识别问题开始,在分析前准备和处理数据,并以数据可视化结束。

大数据分析生命周期:

作者 Thomas Erl、Wajid Khattak 和 Paul Buhler 在他们的书《大数据基础:概念、驱动程序和技术》中提出了大数据分析生命周期。他们的生命周期建议将阶段分为九个步骤:

1.商业案例评估

2.数据识别

3.数据采集和过滤

4.数据提取

5.数据验证和清理

6.数据聚合和表示

7.数据分析

8.数据可视化

9.分析结果的利用

这个生命周期似乎比以前的生命周期模型多三四个步骤。但实际上,他们只是将我们所说的准备和处理分解为更小的步骤。它强调在分析阶段之前收集、准备和清理数据所需的各个任务。

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/457796.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号