Hurwitz 平方和定理
Hurwitz 平方和定理是有限群表示论的一个精彩应用,本文是若干年前读书时的笔记。
Hurwitz 平方和定理
我们都熟悉复数的乘法:如果 z_1=x_1+y_1i,z_2=x_2+y_2i 是两个复数,则 |z_1z_2|=|z_1|\cdot|z_2|,也就是
(x_1^2+y_1^2)(x_2^2+y_2^2)=(x_1x_2-y_1y_2)^2+(x_1y_2+x_2y_1)^2.
1748 年 Euler 发现了如下的 4 平方和等式:
(x_1^2+x_2^2+x_3^2+x_4^2)(y_1^2+y_2^2+y_3^2+y_4^2)=z_1^2+z_2^2+z_3^2+z_4^2.
其中
\begin{align*}&z_1=x_1y_1-x_2y_2-x_3y_3-x_4y_4,\\&z_2=x_1y_2+x_2y_1+x_3y_4-x_4y_3,\\&z_3=x_1y_3+x_3y_1-x_2y_4+x_4y_2,\\&z_4=x_1y_4+x_4y_1+x_2y_3-x_3y_2.\end{align*}
4 平方和等式说的是在 Hamilton 四元数体中范数仍然是乘性的。1848 年 Caley 发现了八元数,从而导出了类似的 8 平方和等式,当然具体写出来会很复杂,这里就按下不表了。
一般地,如果能在 n 维欧式空间 \mathbb{R}^n 上定义向量之间的乘法:
\mathbb{R^n}\times\mathbb{R^n}\rightarrow\mathbb{R^n}:(v,w)\rightarrow v\times w
使得 v\times w 对 v,w 都是线性的,而且乘积的范数等于范数的乘积:|v\times w|=|v|\cdot |w|(这里 |\cdot| 是通常的欧式范数),则我们就得到了一个 n 平方和等式。
在接下来的 50 年里,人们一直致力于寻找可能的 16 平方和等式,但是都失败了,于是开始怀疑是否没有这样的等式成立。终于在 1898 年 Hurwitz 证明了这样的结论:
Hurwitz 平方和定理:设 x=(x_1,\ldots,x_n), y=(y_1,\dots,y_n) 为 \mathbb{R}^n 中的向量。如果存在关于 x,y 的双线性函数 z_1(x,y),\ldots,z_n(x,y) 使得等式
(x_1^2+\cdots+x_n^2)(y_1^2+\cdots+y_n^2)=z_1^2+\cdots+z_n^2
恒成立, 那么 n=1,2,4,8。
正如前面说过的,Huiwitz 平方和定理说的是在实数域 \mathbb{R},复数域 \mathbb{C},四元数 \mathbb{H} 和八元数 \mathbb{O} 中,元素的(欧式)范数和向量的乘法是相容的,而在其它维数的 \mathbb{R}^n 上是不可能定义与欧式范数相容的向量乘法的。
Hurwitz 本人的证明是纯线性代数的,线性代数的证明较为初等,不过步骤略长。1943 年 Eckmann 用有限群表示论的方法给了一个漂亮的证明,本文就来介绍这个证明。
将问题转化为矩阵方程
设 z=(z_1,\ldots,z_n),则 z 关于 y 是线性的,因此存在 n 阶矩阵 A 满足 z=yA,当然矩阵 A 和 x 有关。于是 Hurwitz 定理中的等式变成
(x_1^2+x_2^2+\cdots+x_n^2)yy'=yAA'y'.
由于 y 是不定元,因此
AA'=(x_1^2+\cdots+x_n^2)I_n.
进一步,由于 A 关于 x 也是线性的,因此设 A=A_1x_1+\cdots+A_nx_n,则
AA'=\sum_{i=1}^nA_iA_i'x_i^2+\sum_{1\leq i<j\leq n}(A_iA_j'+A_jA_i')x_ix_j.
从而我们得到一组矩阵方程
A_iA_i'=I_n,\quad A_iA_j'+A_jA_i'=0 \quad \text{for}\ i\ne j.
进一步可以把 A_n 归一化为单位矩阵:令 Q_i=A_iA_n^{-1},于是 Q_1,\ldots,Q_{n-1} 满足
Q_i'=-Q_i,\quad Q_i^2=-I_n,\quad Q_iQ_j=-Q_jQ_i\quad\text{for}\ i\ne j.
显然 n 必须是偶数(奇数阶反对称矩阵行列式都是 0),而 n=2 的时候结论是成立的,所以下面我们都假定 n>2,于是 n 的可能值为 4,6,8,\ldots
用群表示论的工具得出矛盾
考虑这样一个抽象群 G,它由元素 a,g_1,\ldots,g_{n-1} 生成,且
a^2=1,\quad g_i^2=a,\quad g_ig_j=ag_jg_i\ \text{when}\ i\ne j.
这个群的结构很好分析:
|G|=2^n,每个元素形如 a^{e_0}g_1^{e_1}\cdots g_{n-1}^{e_{n-1}},其中 e_i\in\{0,1\}。
G 的中心 Z(G)=\{1,a,g_1g_2\cdots g_{n-1},ag_1g_2\cdots g_{n-1}\}。
G 的换位子群 [G,G]=\{1,a\},从而 G 有 2^{n-1} 个线性表示。
G 的任何非平凡共轭类都只有两个元素 \{g,ag\},从而 G 有 2^{n-1}+2 个共轭类,其不可约复表示的个数也是 2^{n-1}+2。
于是我们知道 G 有 2^{n-1} 个一次表示,还有 2 个次数大于 1 的表示,设它俩的次数分别是 f_1,f_2,根据不可约表示次数的平方和等于 G 的阶,得到方程
f_1^2+f_2^2 =2^{n-1}.
再利用不可约表示的次数整除 G 的阶,知道 f_1 和 f_2 都是 2 的幂,这只有一种可能,就是
f_1=f_2=2^{\frac{n}{2}-1}.
现在 Hurwitz 矩阵方程给出了 G 的一个 n 维表示,这个表示可以分解为若干不可约表示的直和,我们断言其中不含有一次表示,从而只能是若干个 2^{\frac{n}{2}-1} 次表示的直和:这是因为元素 a 在这个表示下是 n 阶矩阵 -I_n,从而其在任何不变子空间上的作用都是乘以 -1。但是任何一次表示都把 a\in [G,G] 映射为 1,矛盾!
于是 2^{\frac{n}{2}-1}\big| n,设 n=2^r\cdot s,其中 s 为奇数,则 \frac{n}{2}-1\leq r,从而
2^r\leq n\leq 2r+2.
注意 n 是偶数,所以只能是 n=4,6,8,这就完成了 Hurwitz 定理的证明。