【持续更新】面试复习整理

写在前面

基本都是从网上solo来的题目，也有一些平时看到感觉会被问的整理进去的题目主要为了毕业面试…… NLP/机器学习方向的算法岗面试问题整理问题答案均持续更新，持续到23年3月份吧，如果我还没找到工作的话

NLP

机器学习基本概念

评估指标

数据降维

线性回归

线性回归的两种损失函数

K-Means

SVM

SMV的优化函数为什么优化问题中间隔γ可以取1偏离margin较近的错分样本和偏离margin较远的错分样本损失是否一样什么是hinge loss如何处理线性不可分的数据什么是oneClass SVM什么是决策平面什么是支持向量什么是硬间隔/软间隔KKT条件是什么为什么能用KKT条件SMO算法什么是拉格朗日对偶问题为什么能用对偶条件如何选择需要更新的 α alpha α有哪些经典的核函数

决策树

集成学习基本概念

bagging和boosting的区别

-	bagging	boosting
运行方式	并行	串行
异常值	不敏感	敏感
结果	表决决定	累加决定
分类器权值	一致	不一致

bagging

boosting

逻辑回归

贝叶斯

贝叶斯公式条件概率公式全概率公式朴素贝叶斯的前提要求朴素贝叶斯的计算过程朴素贝叶斯和贝叶斯有什么区别HMM的维特比算法CRF的本质

GMM

E-step的目的M-step的目的

深度学习基本概念

LSTM

CNN

CNN的特点CNN的原理CNN的卷积层参数量CNN的权重/偏置更新方式，和BP的区别max/average pooling层梯度回传方式卷积核为什么都是奇数给定卷积核和步长计算output维度 GNN

其他

编程语言

数据结构

若它的左子树不空，则左子树上所有结点的值均小于它的根结点的值若它的右子树不空，则右子树上所有结点的值均大于它的根结点的值它的左、右子树也分别为二叉排序树。二叉搜索树的优点
1）有链表的快速插入与删除操作的特点
2）有数组快速查找的优势什么是前缀树什么是完全二叉树什么是平衡二叉树一个具有N个节点的完全二叉树深度是多少，叶子节点是多少链表和线性表的区别array和hash set的区别如何判断一个算法是线性的还是非线性的什么是哈希冲突

数学问题

具体题目

其他

以wordcount为例子来说一下hadoop的数据走的流程，sort阶段发生在什么时候什么是死锁如何预防死锁linux查找某个正在运行的进程linux查看显存linux杀死进程

代码题目

深度优先搜索的非递归写法广度优先搜索的非递归写法

【持续更新】面试复习整理

大数据系统相关栏目本月热门文章