矩阵群

基本的矩阵群

  • 从线性方程出发中,我们有可逆矩阵。在数值线性代数中,我们有正交矩阵、酉矩阵
  • n \times n矩阵的集合为M_n(\mathbb{K}),其中\mathbb{K} = \mathbb{R}, \mathbb{C}
    • 可逆矩阵的集合为一般线性群

          \[ GL_n(\mathbb{K}) = \{ g \in M_n(\mathbb{K}) : \det(g) \neq 0 \}. \]

      进一步,令行列式为1,可得特殊线性群

          \[ SL_n(\mathbb{K}) = \{ g \in M_n(\mathbb{K}) : \det(g) = 1 \}. \]

    • 正交矩阵的集合为正交群

          \[ O_n(\mathbb{K}) = \{ g \in M_n(\mathbb{K}) : gg^T = I \}. \]

      进一步,令行列式为1,可得特殊正交群

          \[ SO_n(\mathbb{K}) = \{ g \in M_n(\mathbb{K}) : gg^T = I,\; \det(g) = 1 \}. \]

    • 酉矩阵的集合为酉群

          \[ U_n(\mathbb{K}) = \{ g \in M_n(\mathbb{K}) : gg^* = I \}. \]

      进一步,令行列式为1,可得特殊酉群

          \[ SU_n(\mathbb{K}) = \{ g \in M_n(\mathbb{K}) : gg^* = I,\; \det(g) = 1 \}. \]

  • 矩阵群之间的关系
    • GL_n(\mathbb{K})SL_n(\mathbb{K})的行列式相差的倍数为\epsilon \neq 0,故

          \[ GL_n(\mathbb{K}) / SL_n(\mathbb{K}) \cong \mathbb{K} - \{ 0 \}, \]

      其中,商群的等价类为

          \[ g \cdot SL_n(\mathbb{K}), \text{ where } g = \begin{bmatrix}\epsilon & & & \\ & 1 & & \\ & & \ddots & \\ & & & 1\end{bmatrix},\; \epsilon \neq 0. \]

    • O_n(\mathbb{R})SO_n(\mathbb{R})的行列式相差的倍数为\epsilon = \pm 1,故

          \[ O_n(\mathbb{R}) / SO_n(\mathbb{R}) \cong \mathbb{Z}_2, \]

      其中,商群的等价类为

          \[ g \cdot SO_n(\mathbb{R}), \text{ where } g = \begin{bmatrix}\epsilon & & & \\ & 1 & & \\ & & \ddots & \\ & & & 1\end{bmatrix},\; \epsilon = \pm 1. \]

    • U_n(\mathbb{C})SU_n(\mathbb{C})的行列式相差的倍数为\epsilon = e^{i\theta},故

          \[ U_n(\mathbb{C}) / SU_n(\mathbb{C}) \cong S^1, \]

      其中,商群的等价类为

          \[ g \cdot SU_n(\mathbb{C}), \text{ where } g = \begin{bmatrix}\epsilon & & & \\ & 1 & & \\ & & \ddots & \\ & & & 1\end{bmatrix},\; \epsilon = e^{i\theta}. \]

  • 上面的群有些是重复的,

        \[ O_n(\mathbb{R}) = U_n(\mathbb{R}),\; SO_n(\mathbb{R}) = SU_n(\mathbb{R}). \]

    不过,

        \[ O_n(\mathbb{C}) \neq U_n(\mathbb{C}),\; SO_n(\mathbb{C}) \neq SU_n(\mathbb{C}). \]

    在不同的地方,矩阵群的记号有不同的形式,比如

        \[ O_n(\mathbb{R}) = O(n, \mathbb{R}) = O(n),\; SO_n(\mathbb{R}) = SO(n, \mathbb{R}) = SO(n), \]

        \[ U_n(\mathbb{C}) = U(n, \mathbb{C}) = U(n),\; SU_n(\mathbb{C}) = SU(n, \mathbb{C}) = SU(n). \]

保持形式的群

  • 数值线性代数中,我们有双线性形式、内积、实对称矩阵、Hermite矩阵
  • \mathbb{K}^n上的双线性形式为

        \[ \beta(x, y) = x^TBy. \]

    • 更换一组基底对应于合同变换,B可以化归为对角矩阵\Lambda
    • 在复数域上,我们可以对复数开平方根,所以\Lambda的元素可以化归为0、1(在实数域上,我们只能对非负实数开平方根,所以\Lambda的元素可以化归为0、1、-1。只包含1 –> 正定,只包含1、0 –> 半正定,只包含-1 –> 负定,只包含-1、0 –> 半负定,同时包含1、-1 –> 不定)
  • 保持双线性形式(对应的二次型)的群为

        \[ Aut(\mathbb{K}^n, \beta) = \{ g \in GL_n(\mathbb{K}) : g^TBg = B \}. \]

    • (对称)不定正交群为

          \[ O_{p, q}(\mathbb{K}) = Aut(\mathbb{K}^{p + q}, \beta),\; B = \begin{bmatrix}I_p & 0 \\ 0 & -I_q\end{bmatrix}. \]

    • (反对称)辛群为

          \[ Sp_{2n}(\mathbb{K}) = Aut(\mathbb{K}^{2n}, \beta),\; B = \begin{bmatrix}0 & I_n \\ -I_n & 0\end{bmatrix}. \]

  • 类似于双线性形式,我们也可以考虑内积。此时,\mathbb{R}\mathbb{C}的情形是不同的
    • (双线性)\mathbb{R}^n上的内积为

          \[ \langle{x, y}\rangle_{\mathbb{R}^n} = x^Ty. \]

      \mathbb{R}^n上的对称、双线性形式对应于实对称矩阵

          \[ \beta(x, y) = x^TBy, \text{ where } B^T = B. \]

      因为\mathbb{R}^n上的内积是双线性形式,所以保持对称、双线性形式(对应的二次型)的群化归为上面的情形
    • (线性-共轭线性)\mathbb{C}^n上的内积为

          \[ \langle{x, y}\rangle_{\mathbb{C}^n} = x^T\overline{y}. \]

      \mathbb{C}^n上的Hermite形式对应于Hermite矩阵

          \[ \beta(x, y) = x^TB\overline{y}, \text{ where } B^* = B. \]

      因为\mathbb{C}^n上的内积不是双线性形式,所以我们需要考虑保持Hermite形式(对应的共轭二次型)的群

          \[ Aut(\mathbb{C}^n, \beta) = \{ g \in GL_n(\mathbb{C}) : g^TB\overline{g} = B \}. \]

      不定酉群为

          \[ U_{p, q}(\mathbb{C}) = Aut(\mathbb{C}^{p + q}, \beta),\; B = \begin{bmatrix}I_p & 0 \\ 0 & -I_q\end{bmatrix}. \]

半直积构成的群

  • NH为群,\varphi: H \to Aut(N)为群同态
    • 半直积N \rtimes_\varphi H上的乘法定义为

          \[ (n, h) \cdot (n', h') = (n \cdot \varphi(h)n', h \cdot h'),\; n, n' \in N,\; h, h' \in H. \]

    • 群同态\varphi等价于HN上的左作用,所以我们通常可以省略\varphi
  • N \rtimes_\varphi H关于乘法构成一个群
    • 单位元为(1_N, 1_H)。逆元由如下等式得到,

          \begin{equation*}\begin{split} (n, h) \cdot (\varphi(h^{-1})n^{-1}, h^{-1}) &= (n \cdot \varphi(h)\varphi(h^{-1})n^{-1}, h \cdot h^{-1}) \\ &= (1_N, 1_H), \\ (\varphi(h^{-1})n^{-1}, h^{-1}) \cdot (n, h) &= (\varphi(h^{-1})n^{-1} \cdot \varphi(h^{-1})n, h^{-1} \cdot h) \\ &= (1_N, 1_H). \end{split}\end{equation*}

    • 结合律由如下等式得到,

          \begin{equation*}\begin{split} &\mathrel{\phantom{=}} [(n_1, h_1) \cdot (n_2, h_2)] \cdot (n_3, h_3) \\ &= (n_1 \cdot \varphi(h_1)n_2, h_1 \cdot h_2) \cdot (n_3, h_3) \\ &= (n_1 \cdot \varphi(h_1)n_2 \cdot \varphi(h_1 \cdot h_2)n_3, h_1 \cdot h_2 \cdot h_3) \\ &= (n_1 \cdot \varphi(h_1)[n_2 \cdot \varphi(h_2)n_3], h_1 \cdot h_2 \cdot h_3) \\ &= (n_1, h_1) \cdot (n_2 \cdot \varphi(h_2)n_3, h_2 \cdot h_3) \\ &= (n_1, h_1) \cdot [(n_2, h_2) \cdot (n_3, h_3)]. \end{split}\end{equation*}

  • 在计算机图形学中,我们有仿射变换、刚体变换。可参见计算机图形学的几何变换
    • 仿射变换为

          \[ f(x) = Ax + b,\; A \in GL_n(\mathbb{R}),\; b \in \mathbb{R}^n. \]

      仿射变换的复合为

          \begin{equation*}\begin{split}f_1 \circ f_2(x) &= A_1(A_2x + b_2) + b_1 \\ &= A_1A_2x + A_1b_2 + b_1.\end{split}\end{equation*}

    • 因此,仿射变换群为\mathbb{R}^n \rtimes GL_n(\mathbb{R}),其中

          \[ (b_1, A_1) \cdot (b_2, A_2) = (b_1 + A_1b_2, A_1A_2). \]

      也就是说,仿射变换群可以分解为一个平移部分、一个可逆的线性变换部分
    • 类似地,Euclid群为

          \[ E_n(\mathbb{R}) = \mathbb{R}^n \rtimes O_n(\mathbb{R}). \]

      进一步,刚体变换群为特殊Euclid群

          \[ SE_n(\mathbb{R}) = \mathbb{R}^n \rtimes SO_n(\mathbb{R}). \]

  • 在经典力学中,我们有Galileo变换;在狭义相对论中,我们有Poincaré变换。可参见Lagrange力学
    • 经典力学中的Galileo变换
      • 如果坐标系更换一组单位正交基,那么物理规律不变,对应的Galileo变换为

            \[ f(r, t) = (Rr, t),\; R \in O_3(\mathbb{R}). \]

        如果坐标系相对于另一个坐标系作匀速直线运动,那么物理规律不变,对应的Galileo变换为

            \[ f(r, t) = (r + vt, t),\; v \in \mathbb{R}^3. \]

        考虑上述2种Galileo变换,变换的复合为

            \begin{equation*}\begin{split}f_1 \circ f_2(r, t) &= (R_1(R_2r + v_2t) + v_1t, t) \\ &= (R_1R_2r + (R_1v_2 + v_1)t, t).\end{split}\end{equation*}

      • 因此,在Galileo变换群中,可逆的线性变换部分为Euclid群E_3(\mathbb{R})。如果再加上空间平移、时间平移

            \[ f(r, t) = (r + r_0, t + t_0),\; r_0 \in \mathbb{R}^3,\; t_0 \in \mathbb{R}, \]

        那么Galileo变换群为\mathbb{R}^4 \rtimes E_3(\mathbb{R})
    • 狭义相对论中的Poincaré变换
      • 光速不变的方程为(假设光速为1)

            \[ dr^2 - dt^2 = 0. \]

        这是一个对称、双线性形式(对应的二次型),Poincaré变换保持它不变
      • 因此,在Poincaré变换群中,可逆的线性变换部分为Lorentz群O_{3, 1}(\mathbb{R})。如果再加上空间平移、时间平移,那么Poincaré变换群为\mathbb{R}^4 \rtimes O_{3, 1}(\mathbb{R})
    • 由上述可知,物理规律和对称性有关,并且对称性可以用群来刻画。在经典力学中,Galileo变换群对应的空间、时间是独立的;在狭义相对论中,Poincaré变换群对应的空间、时间是不独立的