证明思路:
我们令
M = I n − x y ∗ y ∗ x , M \;=\; I_n \;-\;\frac{x\,y^*}{y^*x}, M = I n − y ∗ x x y ∗ ,
其中 x , y ∈ C n x,y\in\mathbb{C}^n x , y ∈ C n ,且 y ∗ x ≠ 0 y^*x\neq 0 y ∗ x = 0 。我们要证明
∥ M ∥ 2 = ∥ x ∥ 2 ∥ y ∥ 2 ∣ y ∗ x ∣ . \bigl\|\,M\,\bigr\|_2
\;=\; \frac{\|x\|_2\,\|y\|_2}{\lvert\,y^*x\,\rvert}. M 2 = ∣ y ∗ x ∣ ∥ x ∥ 2 ∥ y ∥ 2 .
1. 验证 M x = 0 Mx=0 M x = 0 以及 M M M 在某个维度为 ( n − 1 ) (n-1) ( n − 1 ) 的子空间上作用如单位算子
先算 M x M x M x :
M x = ( I n − x y ∗ y ∗ x ) x = x − x y ∗ x y ∗ x = x − x = 0. M x
\;=\; \Bigl(I_n \;-\;\frac{x\,y^*}{y^*x}\Bigr)\,x
\;=\; x \;-\; x\,\frac{y^* x}{\,y^*x\,}
\;=\; x \;-\; x \;=\;0. M x = ( I n − y ∗ x x y ∗ ) x = x − x y ∗ x y ∗ x = x − x = 0.
因此 x x x 是 M M M 的一个特征向量,对应特征值为 0 0 0 。
令
N = { z ∈ C n : y ∗ z = 0 } \mathcal{N} \;=\; \{\,z\in\mathbb{C}^n : y^* z = 0\,\} N = { z ∈ C n : y ∗ z = 0 }
表示向量 z z z 与 y y y 正交(在 C n \mathbb{C}^n C n 的欧几里得内积下)。若 z ∈ N z \in \mathcal{N} z ∈ N ,则 y ∗ z = 0 y^* z = 0 y ∗ z = 0 ,此时
M z = z − x y ∗ y ∗ x z = z − x y ∗ z y ∗ x = z − x 0 y ∗ x = z . M z
\;=\; z \;-\; \frac{x\,y^*}{\,y^*x\,}\,z
\;=\; z \;-\; x\,\frac{y^* z}{\,y^*x\,}
\;=\; z \;-\; x\,\frac{0}{y^*x}
\;=\; z. M z = z − y ∗ x x y ∗ z = z − x y ∗ x y ∗ z = z − x y ∗ x 0 = z .
因此,N \mathcal{N} N (维度为 n − 1 n-1 n − 1 )是 M M M 的一个不变子空间,并且在 N \mathcal{N} N 上,M M M 就等于单位算子。换句话说:
M M M 在方向 x x x 上(严格来说,x x x 与 N \mathcal{N} N 不重合,因为 y ∗ x ≠ 0 y^*x\neq0 y ∗ x = 0 保证了 x ∉ N x\notin\mathcal{N} x ∈ / N )特征值为 0 0 0 。
M M M 在所有与 y y y 正交的方向上,特征值为 1 1 1 。
由此可知:
r a n k ( M ) = n − 1 \mathrm{rank}(M) = n-1 rank ( M ) = n − 1 ,因为 M M M 把 x x x 映为 0,但对与 y y y 正交的所有向量都不改变。
在“线性变换特征值”的意义下, M \,M M 的特征值 是
0 ( 重数 1 ) , 1 ( 重数 n − 1 ) . 0\quad(\text{重数 }1),
\quad
1\quad(\text{重数 }n-1). 0 ( 重数 1 ) , 1 ( 重数 n − 1 ) .
但是要注意,算子范数 ∥ M ∥ 2 \|M\|_2 ∥ M ∥ 2 (也就是谱范数)不仅仅看特征值,而是取 λ max ( M ∗ M ) \sqrt{\lambda_{\max}(M^*M)} λ m a x ( M ∗ M ) 。由于 M M M 不一定是幺正或厄米(一般来说 x y ∗ / ( y ∗ x ) x\,y^*/(y^*x) x y ∗ / ( y ∗ x ) 不是厄米矩阵,所以 M M M 不是厄米投影),仅凭特征值 0 或 1 无法直接得出 ∥ M ∥ 2 \|M\|_2 ∥ M ∥ 2 。我们需要计算其奇异值。
2. 在一个二维子空间里把 M M M 限制下来,计算最大的奇异值
令
S = span { x , y } . \mathcal{S}=\operatorname{span}\{\,x,\;y\,\}. S = span { x , y } .
因为 M M M 已知在与 y y y 正交的子空间上作用如单位算子(奇异值 1 1 1 ),所以如果在 S \mathcal{S} S 中产生了一个奇异值 σ ≥ 1 \sigma\ge1 σ ≥ 1 ,那么
∥ M ∥ 2 = max { 1 , σ } = σ ( 若 σ ≥ 1 ) . \|M\|_2 \;=\; \max\{\,1,\;\sigma\,\} \;=\;\sigma
\quad(\text{若 } \sigma\ge1). ∥ M ∥ 2 = max { 1 , σ } = σ ( 若 σ ≥ 1 ) .
我们只要在 S \mathcal{S} S 这二维子空间中,求出 M M M 的奇异值就足够——因为其他方向(与 y y y 正交的向量)都只对应奇异值 1,不会超过二维子空间中最大那个奇异值。
2.1 构造适当的标准正交基
首先把 y y y 单位化:
e 1 = y ∥ y ∥ 2 , ∥ e 1 ∥ 2 = 1. e_1 \;=\; \frac{y}{\,\|y\|_2\,},\qquad \|e_1\|_2=1. e 1 = ∥ y ∥ 2 y , ∥ e 1 ∥ 2 = 1.
然后,把 x x x 在 e 1 e_1 e 1 方向上的分量提出,剩下的向量做单位化,得到一个与 e 1 e_1 e 1 正交的单位向量 e 2 e_2 e 2 。具体地:
令
c = e 1 ∗ x = y ∗ x ∥ y ∥ . c \;=\; e_1^*\,x \;=\;\frac{y^*x}{\,\|y\|\,}. c = e 1 ∗ x = ∥ y ∥ y ∗ x .
注意这是一个复数;其模长 ∣ c ∣ = ∣ y ∗ x ∣ / ∥ y ∥ \lvert c\rvert = \bigl\lvert y^*x \bigr\rvert/\|y\| ∣ c ∣ = y ∗ x /∥ y ∥ 。
定义
d = ∥ x − c e 1 ∥ 2 . d \;=\; \|\,x - c\,e_1\,\|_2. d = ∥ x − c e 1 ∥ 2 .
必然有
∥ x ∥ 2 2 = ∣ c ∣ 2 + d 2 , \|x\|_2^2 \;=\; |\,c\,|^2 \;+\; d^2, ∥ x ∥ 2 2 = ∣ c ∣ 2 + d 2 ,
因为 x = ( c e 1 ) + ( x − c e 1 ) x = (c\,e_1) + \bigl(x - c\,e_1\bigr) x = ( c e 1 ) + ( x − c e 1 ) ,且这两部分正交。
当 d > 0 d>0 d > 0 时,令
e 2 = x − c e 1 d , e_2 \;=\; \frac{x - c\,e_1}{\,d\,}, e 2 = d x − c e 1 ,
则 { e 1 , e 2 } \{\,e_1,e_2\} { e 1 , e 2 } 在 S \mathcal{S} S 中是一组正交规范基。若 d = 0 d=0 d = 0 ,说明 x x x 与 y y y 线性相关,反而更简单:那时 x ∥ y x\parallel y x ∥ y ,可直接验证 ∥ I − x y ∗ y ∗ x ∥ 2 = ∥ x ∥ ∥ y ∥ ∣ y ∗ x ∣ = 1 \bigl\|I - \tfrac{xy^*}{y^*x}\bigr\|_2 = \tfrac{\|x\|\,\|y\|}{|y^*x|}=1 I − y ∗ x x y ∗ 2 = ∣ y ∗ x ∣ ∥ x ∥ ∥ y ∥ = 1 。下面我们假设 d > 0 d>0 d > 0 ,即 x x x 与 y y y 不共线。
于是,
∥ e 2 ∥ 2 = 1 , e 2 ∗ e 1 = 0 , \|e_2\|_2 \;=\;1,\quad e_2^*\,e_1=0, ∥ e 2 ∥ 2 = 1 , e 2 ∗ e 1 = 0 ,
并且
x = c e 1 + d e 2 , y = ∥ y ∥ e 1 , x \;=\; c\,e_1 \;+\; d\,e_2,
\quad
y \;=\; \|y\|\,e_1, x = c e 1 + d e 2 , y = ∥ y ∥ e 1 ,
其中
c = y ∗ x ∥ y ∥ , d = ∥ x ∥ 2 − ∣ c ∣ 2 = ∥ x ∥ 2 − ∣ y ∗ x ∣ 2 ∥ y ∥ 2 . c = \frac{y^*x}{\|y\|},
\quad
d = \sqrt{\|x\|^2 - |c|^2}
= \sqrt{\|x\|^2 - \frac{|y^*x|^2}{\|y\|^2}}. c = ∥ y ∥ y ∗ x , d = ∥ x ∥ 2 − ∣ c ∣ 2 = ∥ x ∥ 2 − ∥ y ∥ 2 ∣ y ∗ x ∣ 2 .
2.2 在 { e 1 , e 2 } \{e_1,e_2\} { e 1 , e 2 } 基下表示 M M M 并求其奇异值
现在我们只考察 M M M 在 S \mathcal{S} S 上的作用。任取基向量 e 1 , e 2 e_1,e_2 e 1 , e 2 :
计算 M e 1 M e_1 M e 1 :
M e 1 = e 1 − x y ∗ y ∗ x e 1 . M e_1
\;=\; e_1 \;-\; \frac{x\,y^*}{\,y^*x\,}\,e_1. M e 1 = e 1 − y ∗ x x y ∗ e 1 .
因为 y ∗ e 1 = ∥ y ∥ y^* e_1 = \|y\| y ∗ e 1 = ∥ y ∥ (注意 e 1 = y / ∥ y ∥ e_1=y/\|y\| e 1 = y /∥ y ∥ ),y ∗ x = c ∥ y ∥ y^*x = c\,\|y\| y ∗ x = c ∥ y ∥ 。于是
y ∗ y ∗ x e 1 = ∥ y ∥ c ∥ y ∥ = 1 c , \frac{y^*}{\,y^*x\,}\,e_1
\;=\; \frac{\|y\|}{\,c\,\|y\|\,}
\;=\; \frac{1}{c}, y ∗ x y ∗ e 1 = c ∥ y ∥ ∥ y ∥ = c 1 ,
因此
M e 1 = e 1 − x ( y ∗ e 1 ) / ( y ∗ x ) = e 1 − x ∥ y ∥ y ∗ x = e 1 − x ∥ y ∥ c ∥ y ∥ = e 1 − x c . M e_1
= e_1 \;-\; x\,(y^*e_1)/(y^*x)
= e_1 \;-\; x\,\frac{\|y\|}{\,y^*x\,}
= e_1 \;-\; x\,\frac{\|y\|}{\,c\,\|y\|\,}
= e_1 \;-\; \frac{x}{\,c\,}. M e 1 = e 1 − x ( y ∗ e 1 ) / ( y ∗ x ) = e 1 − x y ∗ x ∥ y ∥ = e 1 − x c ∥ y ∥ ∥ y ∥ = e 1 − c x .
用 x = c e 1 + d e 2 x = c\,e_1 + d\,e_2 x = c e 1 + d e 2 代入:
M e 1 = e 1 − c e 1 + d e 2 c = e 1 − ( e 1 + d c e 2 ) = − d c e 2 . M e_1
= e_1 \;-\; \frac{\,c\,e_1 + d\,e_2\,}{\,c\,}
= e_1 \;-\;\bigl(e_1 + \tfrac{d}{c}\,e_2\bigr)
= -\,\frac{d}{\,c\,}\;e_2. M e 1 = e 1 − c c e 1 + d e 2 = e 1 − ( e 1 + c d e 2 ) = − c d e 2 .
记
b = d c , 则 M e 1 = − b e 2 . b \;=\;\frac{d}{\,c\,},
\quad
\text{则}
\;M e_1 = -\,b\,e_2. b = c d , 则 M e 1 = − b e 2 .
注意到
∣ b ∣ = ∣ d ∣ ∣ c ∣ = ∥ x ∥ 2 − ∣ c ∣ 2 ∣ c ∣ = ∥ x ∥ 2 − ∣ y ∗ x ∣ 2 ∥ y ∥ 2 ∣ y ∗ x ∥ y ∥ ∣ = ∥ x ∥ 2 ∥ y ∥ 2 − ∣ y ∗ x ∣ 2 ∣ y ∗ x ∣ . |b|
= \frac{|d|}{\,|c|\,}
= \frac{\sqrt{\|x\|^2 - \lvert c\rvert^2}}{\;\lvert c\rvert\;}
= \frac{\sqrt{\|x\|^2 - \dfrac{|\,y^*x\,|^2}{\|y\|^2}}}{\,\bigl|\tfrac{y^*x}{\|y\|}\bigr|\;}
= \frac{\sqrt{\; \|x\|^2\,\|y\|^2 \;-\; |\,y^*x\,|^2 \;}}{\;|\,y^*x\,|\;}. ∣ b ∣ = ∣ c ∣ ∣ d ∣ = ∣ c ∣ ∥ x ∥ 2 − ∣ c ∣ 2 = ∥ y ∥ y ∗ x ∥ x ∥ 2 − ∥ y ∥ 2 ∣ y ∗ x ∣ 2 = ∣ y ∗ x ∣ ∥ x ∥ 2 ∥ y ∥ 2 − ∣ y ∗ x ∣ 2 .
我们稍后会看到,这个 ∣ b ∣ \lvert b\rvert ∣ b ∣ 与最终结果直接相关。
计算 M e 2 M e_2 M e 2 :
由于 e 2 ⊥ y e_2 \perp y e 2 ⊥ y ,故 y ∗ e 2 = 0 y^* e_2 =0 y ∗ e 2 = 0 。于是
M e 2 = e 2 − x y ∗ y ∗ x e 2 = e 2 − x 0 y ∗ x = e 2 . M e_2
\;=\; e_2 \;-\; \frac{x\,y^*}{\,y^*x\,}\,e_2
\;=\; e_2 \;-\; x\;\frac{0}{\,y^*x\,}
\;=\; e_2. M e 2 = e 2 − y ∗ x x y ∗ e 2 = e 2 − x y ∗ x 0 = e 2 .
所以 M M M 在向量 e 2 e_2 e 2 上只是恒等作用。
综上,在 { e 1 , e 2 } \{e_1,e_2\} { e 1 , e 2 } 这组正交基下,M M M 于子空间 S = s p a n { e 1 , e 2 } \mathcal{S}=\mathrm{span}\{e_1,e_2\} S = span { e 1 , e 2 } 上的矩阵表示(写成列向量为像的位置)就是
M ∣ S = [ M e 1 ∣ M e 2 ] ⟷ ( 0 0 − b 1 ) , M\bigl|_{\mathcal{S}}
=\;
\begin{bmatrix}
\;M\,e_1\;\big|\;M\,e_2
\end{bmatrix}
\;\longleftrightarrow\;
\begin{pmatrix}
0 & 0 \\[-1ex]
-\,b & 1
\end{pmatrix}, M S = [ M e 1 M e 2 ] ⟷ ( 0 − b 0 1 ) ,
其中我们把 M e 1 = − b e 2 M e_1 = -\,b\,e_2 M e 1 = − b e 2 写作第一列 [ 0 − b ] \bigl[\! {0\atop -b}\!\bigr] [ − b 0 ] (因为它在基 { e 1 , e 2 } \{e_1,e_2\} { e 1 , e 2 } 下的坐标是 ( 0 , − b ) (0,\,-b) ( 0 , − b ) ),把 M e 2 = e 2 M e_2=e_2 M e 2 = e 2 写作第二列 [ 0 1 ] \bigl[\!{0\atop 1}\!\bigr] [ 1 0 ] 。
2.3 计算这 2 × 2 2\times 2 2 × 2 矩阵的奇异值
设
A = ( 0 0 − b 1 ) 在基 ( e 1 , e 2 ) 下就是 M ∣ S . A \;=\;
\begin{pmatrix}
0 & 0 \\[6pt]
-\,b & 1
\end{pmatrix}
\quad\text{在基 }(e_1,e_2)\text{ 下就是 }M|_{\mathcal{S}}. A = ( 0 − b 0 1 ) 在基 ( e 1 , e 2 ) 下就是 M ∣ S .
我们要找它的奇异值,也就是先求 A ∗ A A^*A A ∗ A 的特征值。注意
A ∗ = ( 0 − b ‾ 0 1 ) , A ∗ A = ( 0 − b ‾ 0 1 ) ( 0 0 − b 1 ) = ( ∣ b ∣ 2 − b ‾ − b 1 ) . A^*
\;=\;
\begin{pmatrix}
0 & -\overline{b} \\[6pt]
0 & 1
\end{pmatrix},
\quad
A^* A
\;=\;
\begin{pmatrix}
0 & -\overline{b} \\[6pt]
0 & 1
\end{pmatrix}
\begin{pmatrix}
0 & 0 \\[6pt]
-\,b & 1
\end{pmatrix}
\;=\;
\begin{pmatrix}
|\,b\,|^2 & -\,\overline{b} \\[6pt]
-\,b & 1
\end{pmatrix}. A ∗ = ( 0 0 − b 1 ) , A ∗ A = ( 0 0 − b 1 ) ( 0 − b 0 1 ) = ( ∣ b ∣ 2 − b − b 1 ) .
令 λ \lambda λ 为 A ∗ A A^*A A ∗ A 的一个特征值,则
det ( A ∗ A − λ I ) = det ( ∣ b ∣ 2 − λ − b ‾ − b 1 − λ ) = ( ∣ b ∣ 2 − λ ) ( 1 − λ ) − ( − b ‾ ) ( − b ) . \det\Bigl(\,A^*A - \lambda I\Bigr)
= \det\begin{pmatrix}
|\,b\,|^2 - \lambda & -\overline{b} \\[6pt]
-\,b & 1 - \lambda
\end{pmatrix}
= \bigl(|\,b\,|^2 -\lambda\bigr)\,(1-\lambda)\;-\;(-\overline{b})(-\,b). det ( A ∗ A − λ I ) = det ( ∣ b ∣ 2 − λ − b − b 1 − λ ) = ( ∣ b ∣ 2 − λ ) ( 1 − λ ) − ( − b ) ( − b ) .
展开得到
( ∣ b ∣ 2 − λ ) ( 1 − λ ) − ∣ b ∣ 2 = ( ∣ b ∣ 2 − λ ) ( 1 − λ ) − ∣ b ∣ 2 = ∣ b ∣ 2 − ( ∣ b ∣ 2 ) λ − λ + λ 2 − ∣ b ∣ 2 = λ 2 − ( ∣ b ∣ 2 + 1 ) λ . \bigl(|\,b\,|^2 -\lambda\bigr)\,(1-\lambda) \;-\; |\,b\,|^2
= (|b|^2 - \lambda)(1-\lambda) \;-\; |b|^2
= |b|^2 - (|b|^2)\lambda - \lambda + \lambda^2 - |b|^2
= \lambda^2 \;-\;\bigl(|b|^2 + 1\bigr)\,\lambda. ( ∣ b ∣ 2 − λ ) ( 1 − λ ) − ∣ b ∣ 2 = ( ∣ b ∣ 2 − λ ) ( 1 − λ ) − ∣ b ∣ 2 = ∣ b ∣ 2 − ( ∣ b ∣ 2 ) λ − λ + λ 2 − ∣ b ∣ 2 = λ 2 − ( ∣ b ∣ 2 + 1 ) λ .
这说明 A ∗ A A^*A A ∗ A 的特征多项式是
λ ( λ − ( ∣ b ∣ 2 + 1 ) ) = 0 , \lambda\,\bigl(\,\lambda - \bigl(|b|^2 +1\bigr)\bigr) = 0, λ ( λ − ( ∣ b ∣ 2 + 1 ) ) = 0 ,
因此它的两个特征值是
λ 1 = 0 , λ 2 = ∣ b ∣ 2 + 1. \lambda_1 = 0,
\qquad
\lambda_2 = |b|^2 + 1. λ 1 = 0 , λ 2 = ∣ b ∣ 2 + 1.
据此,矩阵 A A A 的奇异值(即 特征值 \sqrt{\text{特征值}} 特征值 )是
σ 1 = 0 = 0 , σ 2 = ∣ b ∣ 2 + 1 . \sigma_1 = \sqrt{0} = 0,
\qquad
\sigma_2 = \sqrt{\,|b|^2 + 1\,}. σ 1 = 0 = 0 , σ 2 = ∣ b ∣ 2 + 1 .
由于这是 A A A 作为 2 × 2 2\times2 2 × 2 矩阵在子空间 S \mathcal{S} S 上的所有奇异值,而 M M M 在正交于 S \mathcal{S} S 的补空间上恰好作用为单位算子,对应奇异值 1 1 1 (重数 n − 2 n-2 n − 2 )。因此在全集 C n \mathbb{C}^n C n 上,M M M 的奇异值集合是
{ 0 , 1 ( 重 n − 2 ) , ∣ b ∣ 2 + 1 } . \{\,0,\; 1\;(\text{重 }n-2),\; \sqrt{|b|^2 + 1}\}. { 0 , 1 ( 重 n − 2 ) , ∣ b ∣ 2 + 1 } .
于是
∥ M ∥ 2 = max { 1 , ∣ b ∣ 2 + 1 } = ∣ b ∣ 2 + 1 , \|\,M\,\|_2
\;=\; \max\{\,1,\;\sqrt{|b|^2 + 1}\,\}
\;=\; \sqrt{|b|^2 + 1}, ∥ M ∥ 2 = max { 1 , ∣ b ∣ 2 + 1 } = ∣ b ∣ 2 + 1 ,
因为下面会证明 ∣ b ∣ 2 + 1 ≥ 1 \sqrt{|b|^2 + 1}\ge1 ∣ b ∣ 2 + 1 ≥ 1 。
2.4 简化 ∣ b ∣ 2 + 1 \sqrt{|b|^2 + 1} ∣ b ∣ 2 + 1 的表达式
前面我们已经算出
∣ b ∣ = ∥ x ∥ 2 2 ∥ y ∥ 2 2 − ∣ y ∗ x ∣ 2 ∣ y ∗ x ∣ . |b|
\;=\; \frac{\sqrt{\;\|x\|_2^2\,\|y\|_2^2 - \lvert\,y^*x\,\rvert^2\;}}{\;\lvert\,y^*x\,\rvert\;}. ∣ b ∣ = ∣ y ∗ x ∣ ∥ x ∥ 2 2 ∥ y ∥ 2 2 − ∣ y ∗ x ∣ 2 .
因此
∣ b ∣ 2 = ∥ x ∥ 2 2 ∥ y ∥ 2 2 − ∣ y ∗ x ∣ 2 ∣ y ∗ x ∣ 2 ⟹ ∣ b ∣ 2 + 1 = ∥ x ∥ 2 2 ∥ y ∥ 2 2 − ∣ y ∗ x ∣ 2 ∣ y ∗ x ∣ 2 + 1 = ∥ x ∥ 2 2 ∥ y ∥ 2 2 ∣ y ∗ x ∣ 2 . |b|^2
= \frac{\|x\|_2^2\,\|y\|_2^2 - |\,y^*x\,|^2}{\,|\,y^*x\,|^2\,}
\quad\Longrightarrow\quad
|b|^2 + 1
= \frac{\|x\|_2^2\,\|y\|_2^2 - |\,y^*x\,|^2}{\,|y^*x|^2\,} \;+\; 1
= \frac{\|x\|_2^2\,\|y\|_2^2}{\,|\,y^*x\,|^2\,}. ∣ b ∣ 2 = ∣ y ∗ x ∣ 2 ∥ x ∥ 2 2 ∥ y ∥ 2 2 − ∣ y ∗ x ∣ 2 ⟹ ∣ b ∣ 2 + 1 = ∣ y ∗ x ∣ 2 ∥ x ∥ 2 2 ∥ y ∥ 2 2 − ∣ y ∗ x ∣ 2 + 1 = ∣ y ∗ x ∣ 2 ∥ x ∥ 2 2 ∥ y ∥ 2 2 .
于是
∣ b ∣ 2 + 1 = ∥ x ∥ 2 ∥ y ∥ 2 ∣ y ∗ x ∣ . \sqrt{|b|^2 + 1}
\;=\;
\frac{\,\|x\|_2\,\|y\|_2\,}{\;\bigl|y^*x\bigr|\;}. ∣ b ∣ 2 + 1 = y ∗ x ∥ x ∥ 2 ∥ y ∥ 2 .
因为 ∥ x ∥ 2 > 0 \|x\|_2>0 ∥ x ∥ 2 > 0 、∥ y ∥ 2 > 0 \|y\|_2>0 ∥ y ∥ 2 > 0 并且 ∣ y ∗ x ∣ > 0 \lvert\,y^*x\,\rvert>0 ∣ y ∗ x ∣ > 0 ,显然得到的数 ∥ x ∥ ∥ y ∥ ∣ y ∗ x ∣ ≥ 1 \frac{\|x\|\,\|y\|}{|\,y^*x\,|}\ge 1 ∣ y ∗ x ∣ ∥ x ∥ ∥ y ∥ ≥ 1 ;与之前比较可知
∥ M ∥ 2 = ∣ b ∣ 2 + 1 = ∥ x ∥ 2 ∥ y ∥ 2 ∣ y ∗ x ∣ . \|\,M\,\|_2
= \sqrt{|b|^2 + 1}
= \frac{\|x\|_2\,\|y\|_2}{\;\lvert\,y^*x\,\rvert\;}. ∥ M ∥ 2 = ∣ b ∣ 2 + 1 = ∣ y ∗ x ∣ ∥ x ∥ 2 ∥ y ∥ 2 .
这正是要证明的结论。
3. 结论
综上所述,我们已经证明了,对于任意 n > 1 n>1 n > 1 、x , y ∈ C n x,y\in\mathbb{C}^n x , y ∈ C n ,只要 y ∗ x ≠ 0 y^*x\neq0 y ∗ x = 0 ,定义
M = I n − x y ∗ y ∗ x , M = I_n \;-\;\frac{x\,y^*}{\,y^*x\,}, M = I n − y ∗ x x y ∗ ,
则其算子 2-范数(谱范数)为
∥ I n − x y ∗ y ∗ x ∥ 2 = ∥ x ∥ 2 ∥ y ∥ 2 ∣ y ∗ x ∣ . \boxed{
\bigl\|\,I_n \;-\;\tfrac{x\,y^*}{\,y^*x\,}\bigr\|_2
\;=\; \frac{\|x\|_2\,\|y\|_2}{\lvert\,y^*x\,\rvert}.
} I n − y ∗ x x y ∗ 2 = ∣ y ∗ x ∣ ∥ x ∥ 2 ∥ y ∥ 2 .
这正是题目所要证明的。 ∎