栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

【数据分析/商业分析】面试题整理——统计学/机器学习/业务专题

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

【数据分析/商业分析】面试题整理——统计学/机器学习/业务专题

  • SQL编程专题:【数据分析/商业分析】面试题整理——SQL专题

文章目录
    • 统计学
    • 机器学习
    • SQL
    • 大数据
    • 业务知识
    • python


统计学
  1. 怎么做假设检验
  2. 偏态分布怎么处理
  3. 假设检验的基本原理,为什么会是反证的思想
  4. 假设检验的p值,显著性水平是什么,怎么理解
  5. 实验的样本量怎么确定
  6. 卡方,z,t检验的使用场景区别
  7. 如何和一个没有统计背景的人解释MLE
  8. 如果实验组、对照组的流量分配不均匀,如何消除影响
  9. 解释大数定律,中心极限定理
    10.皮尔森相关系数以及如何解读相关、独立、线性相关的区别
机器学习
  1. 两个向量之间的相似性有哪些计算方法
    ①欧氏距离
    ②曼哈顿距离
    ③余弦相似度
    ④杰卡德相似度
  2. 逻辑回归:特点、归一化吗
  3. 完整解释PCA,PCA缺点:高维度数据能使用PCA吗,类别变量onehot能用PCA吗
  4. 特征工程怎么做
  5. ensemble怎么做,怎么提高ensemble的表现
  6. 模型评估指标选择
  7. AUC怎么算
  8. 随机森林算法的原理,为什么优越;样本是有放回还是无放回;特征值是有放回还是无放回
  9. 为什么随机森林的样本是有放回抽样(可以减小方差,类似于bootstrap)
  10. ROC和AUC值的原理
  11. AUC一定越大越好吗,有没有反例。样本极度不均衡时AUC很大,但并不代表效果好
  12. 图算法的考察
  13. 交叉验证
SQL
  1. 除了distinct外还有什么方法去重
  2. paritition by和group by的区别
  3. rank和row_number()区别
  4. 查准率和查全率
  5. left join 和 right join的区别
大数据
  1. hive和hadoop原理
  2. 大数据和普通数据区别
  3. 实时流方面,hadoop
业务知识
  1. 游戏DAU下降分析
  2. 指标:DAU、注册、分享、充值,两个游戏指标有高有低,该给谁流量
  3. 分享率:10个人1个分享,100个人10个分享,如何确定置信性
  4. 如何设计综合指标
  5. 怎么划分用户生命周期
  6. 如何判断即将流失用户
  7. 抖音如何从数据分析的角度进行内容分发
  8. 业务建模方面的能力
  9. 怎样衡量在某个页面做推荐的效果
  10. 怎样衡量在某个页面做搜索的效果
  11. 有一个母婴类app,想了解用户都是什么样的人,会构建怎样的指标体系
  12. 怎么知道直博与受众是否匹配(从直博本身的数据出发)
python
  1. 根据value倒序输出字典
  2. list,tuple,set和defacultdict的区别
转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/840855.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号