为了提高模型对数据复杂关系的拟合能力,在做特征工程时常常对一些特征进行组合,构成高阶特征。
以逻辑回归为例,假设数据特征向量为 X = ( x 1 , x 2 , . . . , x k ) X = (x_1, x_2, ..., x_k) X=(x1,x2,...,xk),则有
Y
=
s
i
g
m
o
i
d
(
∑
i
∑
j
w
i
j
<
x
i
,
x
j
>
)
Y = sigmoid(sum_{i} sum_{j} w_{ij} < x_i, x_j >)
Y=sigmoid(i∑j∑wij
其中
<
x
i
,
x
j
>
< x_i, x_j >
一种行之有效的方法是将
w
i
j
w_{ij}
wij进行矩阵分解,由
m
∗
n
m*n
m∗n分解为两个
m
∗
k
m*k
m∗k、
n
∗
k
n*k
n∗k的矩阵乘法,
k
<
<
m
,
k
<
<
n
k << m, k << n
k< 欢迎关注微信公众号(算法工程师面试那些事儿),本公众号聚焦于算法工程师面试,期待和大家一起刷leecode,刷机器学习、深度学习面试题等,共勉~



