参考回答:
L1是模型各个参数的绝对值之和,L2为各个参数平方和的开方值。L1更趋向于产生少量的特征,其它特征为0,最优的参数值很大概率出现在坐标轴上,从而导致产生稀疏的权重矩阵,而L2会选择更多的矩阵,但是这些矩阵趋向于0。
上一篇 Flutter(Dart):渲染引起的异常/ RenderFlex溢出
下一篇 Flutter中的分页/无限滚动,具有缓存和实时失效功能
版权所有 (c)2021-2022 MSHXW.COM
ICP备案号:晋ICP备2021003244-6号