栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

数据分析面试:业务题

数据分析面试:业务题

文章目录

0. 相关概念1. 你怎么理解数据分析的?数据分析的主要流程是什么?2. 指标的异常波动变化(例如日活下跌),你会如何分析?3. 什么是A/B Test?其核心逻辑是什么?

使用A/B Test评估算法效果 4. 如何理解漏斗分析?有哪些需要注意的点?5. 你认为数据分析的价值如何体现6. 什么是描述性统计?7. 什么是分类?有哪些分类算法?8. 什么是聚类?有哪些聚类算法?9. 什么是回归?有哪些回归算法和应用场景?10. 如何评估一场活动的效果

0. 相关概念

UV:Unique Visitor 独立访问PV:Page View 页面访问量漏斗分析:Funnel AnalysisCR:Conversion Rate 转化率CRV:Click Value Rate 点击率GMV:Gross Merchandise Volume 商品交易总额DAU :Daily Active User 日活用户MAU Monthly Active User 月活用户ARPU:Average Revenue Per User 用户用户收入留存率复购率埋点同比:环比增长速度 = (本期数 - 上期数)/ 上期数 * 100%,会受季节影响环比:环比增长速度 = (本期数 - 同期数)/ 同期数 * 100%,可以排除季节影响相关性:变量之间相互相关,没有先后顺序(比如:y=0.5x)因果性:两个事件的发生有严格的先后顺序(变化可能延迟)… 1. 你怎么理解数据分析的?数据分析的主要流程是什么?

数据分析是基于对业务的理解,发现业务中的问题或潜在的增长点,形成分析思路,并利用数据分析工具进行分析,给出结论和解决方案,并协调各方推动方案落地,解决问题,回到业务中去的完整闭环。

数据分析的主要流程:

观察现状发现问题寻找原因预测未来生成决策推动落地复盘 2. 指标的异常波动变化(例如日活下跌),你会如何分析?

分为以下几个部分:

① 核查数据是否可靠;确定指标计算口径是否一致;确定是否是市场的整体趋势② 描述并分析变化是否合理③ 多维度拆解分析,相关分析等等方法进行分析,寻找造成变化的相关因素④ 进行回归分析/预测,还会持续多久?最坏到什么程度?⑤ 风险/损失评估,下跌对产品的核心KPI有什么影响⑥ 制定策略,挽回损失/避免下次发生 3. 什么是A/B Test?其核心逻辑是什么?

A/B Test是基于小样本的后验方法,通过设置对照组和实验组,对变量进行试验,通过假设检验对不同的结果进行检验,以检验变量是否对结果造成显著影响,从而选取最合理的方法。

其核心逻辑是通过随机合理分流,设置对照组和实验组,通过控制变量法,在保证两组用户除待验证变量不同外,其他变量分布均一致。

使用A/B Test评估算法效果

4. 如何理解漏斗分析?有哪些需要注意的点?

核心逻辑:分解和评估,将业务流程分解为关键环节形成漏斗,通过相邻环节的转化率定位问题环节。

常见漏斗有电商漏斗:首页-详情页-购物车-支付;还有用户生命周期AARRR;用户行为周期AIDMA

注意点:漏斗的各个环节一定是连续的,对应连续的业务流程
一般以上一环节为基准,计算相邻两个环节的转化率,1-转化率即为流失率,但并不意味着最低的环节就是问题环节。

5. 你认为数据分析的价值如何体现

(价值不在与数据,而在于业务,以及背后的原因一家优化方向)

数据分析不是数据统计,不能仅仅停留在输出一份报告,给出一些数字,要给出结论,讲清楚数据背后的业务含义,数字的大小正负说明业务是好是坏,有多好多坏。

除明确数字背后的业务含义外,还要给出背后的原因,好的方面是否可以复用拓展,坏的方面原因是什么,应对方案是什么?要把方案推动落地到业务中执行,并且跟进执行的效果和复盘,螺旋上升,不断迭代优化。

6. 什么是描述性统计?

描述性统计,是指运行图形以及概括性数据来描述数据特征。描述性统计主要包括数据的频数分析、集中趋势分析、离散程度分析、分布以及一些基本的统计图形。

频数分析:在数据预处理部分可以检验异常值数据集中趋势分析:反应数据的一般水平,常用的有平均值、中位数和众数等数据的离散程度分析:反应数据之间的差异程度,主要有方差和标准差数据的分布:在统计分析中,通常要假设样本所属总体的分布属于正态分布,需要用到偏度和峰度两个指标来检查样本数据是否符合正态分布。绘制统计图:用图形的方式来表达数据,比用文字表达更清晰、更简明。 7. 什么是分类?有哪些分类算法?

分类:学习已有分类样本的特征,对新特征进行划分,是一种有监督的机器学习算法。
场景分类算法:

常见分类算:

逻辑回归SVM贝叶斯决策树KNNXGBoost 8. 什么是聚类?有哪些聚类算法?

聚类:对数据的特征进行抽象,通过算法将特征相似的对象划归为一类,是一种无监督机器学习算法。

关键:

如何确定分类对的数量特征如何选择

常用聚类算法:

K-menasDBSCAN

应用场景:

互联网金融用户等级分类垃圾邮箱分类 9. 什么是回归?有哪些回归算法和应用场景?

回归分析:使用线性回归方程对两个或多个变量之间的关系进行建模的一种分析方法。

本质:找到一条最合适的“平均线”或者”超平面“,使得这条线或者这个面两边的点分布均匀。

应用场景:

运营推广中,是不是花的钱越多,买的流量越多,品类越丰富,用户活跃度越高,那么,多到什么程度、大道到什么程度、丰富到什么程度、用户的活跃度最高,留存最高智慧城市的交通,预测交通通塞程度:自变量:时间段、商业指数,住宅指数、城区指数、道路指数;因变量:两个连续信号灯之间道路的通行时间
(联想到费米问题)

常见回归算法:

线性回归lasso回归(拉索回归)ridge回归(岭回归) 10. 如何评估一场活动的效果

具体可以展开来讲,可以从以下几个方面来讲:

1、活动关键指标达成分析
2、活动关键流程漏斗分析
3、活动的渠道、用户分析
4、活动策略、节奏分析

参考:数据分析星球(小红书)

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/762258.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号