人脸识别问题中x是图像,当然图像在计算机中的存储方式是数字矩阵对应图像的像素点阵
每个像素点是用数值来表示RGB或者黑白灰,所以不同的图像所对应的数字矩阵是不同的
在数值分布上会呈现出一定的特征,比如人脸和五官,不管出现在图像中的哪个位置,对应的数值都会有一定的规律。
经过上面步骤的处理,人脸识别的相关问题就都转换成为基于数值矩阵的分类或者回归问题,标签值如果是男女老少这样的类别,那是分类问题,标签值如果是特征点或者定位框,那就是回归问题。
x是各种人脸的照片,包括正面侧面的各种人像照呢,y是眼耳鼻喉这些关键点的坐标,我们的目标是用这些数据训练模型,告诉模型当给定图像是这样的数值矩阵型,对应的人脸特征点在这些位置,我们希望训练好的模型,对于未知的图像可以做出正确的特征点预测。
-------------------------------------------
人脸识别技术,就是人类试图引导人工智能去模仿这种能力,利用节点将人脸变成可见的线条,例如眼窝深度、眼睛间距、鼻头宽度等等。
人脸识别的过程中有4个关键的步骤:
- 人脸检测人脸对齐人脸编码人脸匹配
下面详细说明一下这4个步骤。
人脸检测人脸检测的目的是寻找图片中人脸的位置。当发现有人脸出现在图片中时,不管这个脸是谁,都会标记出人脸的坐标信息,或者将人脸切割出来。
可以使用方向梯度直方图(HOG)来检测人脸位置。先将图片灰度化,接着计算图像中像素的梯度。通过将图像转变成HOG形式,就可以获得人脸位置。
人脸对齐人脸对齐是将不同角度的人脸图像对齐成同一种标准的形状。
先定位人脸上的特征点,然后通过几何变换(仿射、旋转、缩放),使各个特征点对齐(将眼睛、嘴等部位移到相同位置)。
人脸编码人脸图像的像素值会被转换成紧凑且可判别的特征向量,这也被称为模板(template)。理想情况下,同一个主体的所有人脸都应该映射到相似的特征向量。
人脸匹配在人脸匹配构建模块中,两个模板会进行比较,从而得到一个相似度分数,该分数给出了两者属于同一个主体的可能性。
参考链接:https://www.zhihu.com/question/20588370/answer/1067805211、人脸识别的工作原理是什么? - 知乎



