这部分讲的是不同的 范数(norm) 及其计算方法,包括 欧几里得范数(ℓ2 范数)、ℓp 范数、欧几里得距离 以及 矩阵的 Frobenius 范数。我来逐一解释,并举例说明。
1. 欧几里得范数(ℓ2-norm)
公式:
∥xˉ∥2=xˉ⋅xˉ=i=1∑dxi2
解释:
- 这表示 向量的欧几里得范数(或 2-范数),即向量的平方和求平方根(即向量的长度)。
- 计算方式是将向量的所有元素平方后相加,再取平方根。
例子:
设向量 xˉ=(3,4),其欧几里得范数:
∥xˉ∥=32+42=9+16=25=5
这个范数就是向量 xˉ 在二维平面上的长度。
此外,归一化(Normalization) 是指将向量转换为单位向量(长度为 1):
x′ˉ=∥xˉ∥xˉ=5(3,4)=(53,54)
2. ℓp-范数
公式:
∥xˉ∥p=(i=1∑d∣xi∣p)p1
解释:
- 这个是更一般化的 p-范数,p 是一个正整数。
- 当 p=2 时,就是欧几里得范数。
- 当 p=1 时,就是曼哈顿范数(绝对值之和)。
例子:
设向量 xˉ=(3,−4),不同的 p 值计算:
- 1-范数(曼哈顿范数):
∥xˉ∥1=∣3∣+∣−4∣=3+4=7
- 2-范数(欧几里得范数):
∥xˉ∥2=32+(−4)2=9+16=25=5
- 无穷范数(最大值范数,p→∞):
∥xˉ∥∞=max(∣3∣,∣−4∣)=4
3. 欧几里得距离
公式:
∥xˉ−yˉ∥2=i=1∑d(xi−yi)2
解释:
- 这个公式表示两个向量(点)之间的欧几里得距离,即两点间的直线距离。
- 计算方式是:先计算每个对应坐标的差值,然后平方求和,最后取平方根。
例子:
设有两个点 xˉ=(1,2) 和 yˉ=(4,6),其欧几里得距离为:
∥xˉ−yˉ∥=(1−4)2+(2−6)2=(−3)2+(−4)2=9+16=25=5
即,这两个点的欧几里得距离为 5。
4. 矩阵的 Frobenius 范数
公式:
∥A∥F=∥AT∥F=i=1∑nj=1∑kaij2
解释:
- Frobenius 范数 是矩阵中所有元素的平方和再开平方的结果。
- 它可以看作是矩阵元素的 2-范数的推广。
- 这个范数与矩阵的转置无关,即 ∥A∥F=∥AT∥F。
- 物理上,它常被称为 矩阵的能量(energy of matrix)。
例子:
设矩阵:
A=[1324]
其 Frobenius 范数计算如下:
∥A∥F=12+22+32+42=1+4+9+16=30≈5.477
这个值表示矩阵的整体大小,可以用于衡量矩阵的能量或复杂度。
总结
- ℓ2-范数(欧几里得范数):表示向量的长度。
- ℓp-范数:是范数的一般形式,p=1 是曼哈顿距离,p=2 是欧几里得距离。
- 欧几里得距离:表示两个向量或点之间的直线距离。
- Frobenius 范数:表示矩阵中所有元素平方和的平方根,也称为矩阵的能量。
这些范数和距离概念在 机器学习、数据分析、优化问题 等领域都非常重要。例如,K-均值聚类 依赖欧几里得距离,神经网络的权重正则化 可能会用到 ℓ2 范数来防止过拟合。
如果你有进一步的问题,欢迎提问!