2025-11-20 05:52:49
第一段讲讲,L1、L2、L∞这三种范数都是凸的。简单说就是它们图像像碗口朝上的形状,中间凹陷不了。比如画图时选任意两点连线,线都在图像上方。这三种范数在机器学习里用得最多,比如L1做稀疏,L2做平滑,L∞控制最大误差。
第二段详细说说,为什么这三种范数凸。先看L1范数,它计算绝对值之和,比如二维向量(3,4)的L1范数是3+4=7。取两个点比如(1,2)和(3,4),中间点(2,3)的L1范数是5,而原两点加权平均是0.5(3+4)+0.5(7+8)=7.5。5≤7.5成立,说明满足凸函数条件。L2范数同理,比如两点(0,1)和(1,0),中间点(0.5,0.5)的L2范数是√0.5≈0.707,原两点加权平均是0.5√2+0.5√2≈1.414,0.707≤1.414成立。L∞范数取最大值,比如两点(1,3)和(4,2),中间点(2.5,2.5)的L∞范数是2.5,原两点加权平均是0.53+0.54=3.5,2.5≤3.5成立。数学证明显示当p≥1时Lp范数都是凸的,而p<1时不是。所以这三种都是凸的,实际应用里选它们做正则化时,优化问题才有唯一解,训练过程更稳定。
本题链接: