栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

数据分析路线

数据分析路线

数据分析的流程

1、目标确定

 

2、数据获取

 

3、数据清洗

 

4、数据整理

 

5、描述分析

 

6、洞察结论

 

7、撰写报告

 

目标确定

我们需要探究数据分析的目的是什么?是为了解决什么问题?达到什么目标?

 

一般分析目的分为两种:

 

1、针对现有情况 - 描述性分析

 

2、基于现状,预测未来情况 - 预测性分析

 

例如:

 

对于一只股票,分析他的走势,涨跌。这是描述性分析

 

针对这些涨跌,回测应该在什么时间点买入什么时间点卖出。这是预测性分析

 

数据获取

针对目标,就要想要获取哪些数据,数据获取分为两个部分

 

1、字段设计

 

2、数据提取

 

例如:

 

需要分析某销售团队的销售数据,基础指标有平均销售额,销售总额,增减幅度等,但是这些指标在数据库中都没有,那么就需要从数据库中提取现有的字段加以处理得到上面的基础指标 - 这是字段设计

 

从销售软件中导入导出数据,用 SQL 从数据库中导入导出 - 这是数据提取

 

数据清洗

从数据获取的步骤过来后我们就获取到需要的数据了,但是这样的数据我们还没办法直接使用,需要做进一步的处理,这就是数据清洗

 

数据清洗主要是针对空白值、无效值、重复值等异常值。

 

针对异常值得判断识别和处理在之前的数据指标的文章中已经讲过了,没有看过的可以往回看看

 

数据整理

做过清洗过的数据还是没有办法直接使用的,这里需要进行数据整理这一步骤,这一步骤主要是针对数据的格式化。

 

例如:

 

日期的处理,将数据中的日期处理为统一格式

 

行列的格式化

 

基础的计算,如平均值、总额、众数等的歌

 

描述分析

做完上面的数据操作之后就可以开始描述分析了

 

描述分析分为两个部分

 

1、数据描述:描述数据的基本情况,比如数据的总数、时间跨度、数据来源等

 

2、指标统计:结合实际业务分析实际情况的数据指标,比如要分析网站流量,网站的 PV 、IP 、留存、跳转率、转化率等等

 

针对指标统计有四类的主要描述场景

 

1)变化:随着时间的变动的增减变化

 

2)分布:不同层次上的表现,例如地域分布、男女分布、人群分布

 

3)对比:数据项之间的比较

 

4)预测:根据现有的增减幅度,预测未来的变化

 

洞察结论

这个部分是结合你自己数据分析的功底,结合你对于手上所负责的业务的了解程度,这部分是数据报告的核心,也同样体现了你的数据分析能力

 

撰写报告

经过一通分析,你需要将你得出来的内容汇总成数据分析报告

 

数据报告主要包含下面的内容

 

1、报告背景:主要描述你要解决的业务现状

 

2、报告目的:主要描述你要解决什么问题

 

3、数据基本情况:主要体现数据的可信度,你的数据来源是否可靠,数据维度、数据完整性等等

 

4、可视化图表:数据的可理解程度,增强看报表的人的理解

 

5、策略选择:提出解决方案,阐述你的结论,提供解决策略等。

 

 

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/710672.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号