从切空间到局部

微分

  • 数列的分析
    • 差分\Delta x_n = x_n - x_{n - 1}
    • 求和\sum_{i = 1}^n x_i = x_1 + \cdots + x_n
    • 差分、求和是逆运算

          \[ \sum_{i = 1}^n\bigg(\Delta x_i\bigg) = x_n - x_0,\; \Delta\bigg(\sum_{i = 1}^n x_i\bigg)  = x_n. \]

  • \mathbb{R}上的分析
    • 差分\Delta f \approx f'(x)\Delta x。差分的极限不是微分

          \[ \Delta f \not\to df = f'(x)dx. \]

    • 然而,差商的极限是微商,求和的极限是积分
      • 差商\frac{\Delta f}{\Delta x} \approx f'(x)。取极限可得导数

            \[ \frac{\Delta f}{\Delta x} \to \frac{df}{dx} = f'(x). \]

      • 求和\sum_a^b f'(x)\Delta x \approx f(b) - f(a)。取极限可得Newton-Leibniz公式

            \[ \sum_a^b f'(x)\Delta x \to \int_a^b f'(x)dx = f(b) - f(a). \]

    • 我们可以形式化地定义微分df。微积分(Calculus)的精髓就在于有限差分的几何直观,以及无穷小微分的形式化演算
    • 形式化演算的好处在于不依赖于人的直觉,所以可以用计算机来计算。比如通过证明论的公理化演算(Axiomatic Calculus)、类型论的Lambda演算(Lambda Calculus),计算机可以自动证明定理

切空间

  • \mathbb{R}^n上的分析
    • 在一点p \in \mathbb{R}^n处,

          \[ df = \sum_i \partial_if \cdot dx^i. \]

    • 数值线性代数可知,如果\{ e_i \}为线性空间V的基底,\{ e^i \}为对偶线性空间V^*的对偶基底,那么

          \[ f = \sum_i \langle{f, e_i}\rangle \cdot e^i,\; f \in V^*. \]

      类似地,如果\{ \partial_i \}为线性空间T_p\mathbb{R}^n的基底,\{ dx^i \}为对偶线性空间T_p^*\mathbb{R}^n的对偶基底,那么对于\langle{df, \partial_i}\rangle = \partial_if,我们有相同的公式

          \[ df = \sum_i \langle{df, \partial_i}\rangle \cdot dx^i,\; df \in T_p^*\mathbb{R}^n. \]

      当指标i同时出现在上方、下方时,我们可以省略求和符号\sum_i,这称为Einstein求和约定
  • 接下来我们考虑一般的T_pM。在计算机图形学中,\mathbb{R}^3中的曲面M可以用参数表示来描述,

        \[ (u^1, u^2) \mapsto (x^1, x^2, x^3). \]

    • f(x^1, x^2, x^3)为函数。f沿着向量v的方向导数为

          \[ \frac{\partial f}{\partial v} = \frac{\partial f}{\partial x^i} \cdot v^i. \]

      f沿着参数u^j的偏导数为

          \[ \frac{\partial f}{\partial u^j} = \frac{\partial f}{\partial x^i} \cdot \frac{\partial x^i}{\partial u^j}. \]

    • 我们有如下的、微分算子和向量之间的对应

          \[ \frac{\partial}{\partial u^j} \mapsto \bigg(\frac{\partial x^1}{\partial u^j}, \frac{\partial x^2}{\partial u^j}, \frac{\partial x^3}{\partial u^j}\bigg) = v, \]

      其中,vM\mathbb{R}^3中的切向量,并且所有v张成M\mathbb{R}^3中的切平面。因此,\frac{\partial}{\partial u^j}对应于切向量,T_pM对应于切空间
  • 对于M = \mathbb{R}^n,我们有

        \[ \frac{\partial}{\partial x^j} \mapsto (0, \ldots, 1 (j^{\text{th}}), \ldots, 0). \]

    T_p\mathbb{R}^n\mathbb{R}^n本身。从而,微分df对应于余切向量,T_p^*\mathbb{R}^n对应于余切空间

从切空间到局部

  • UV \subset \mathbb R^n为开集,a \in U
  • 如果f: U \to VC^1映射,那么fa处的微分为切空间上的切映射,

        \[ df_a: T_aU = \mathbb{R}^n \to T_{f(a)}V = \mathbb{R}^n. \]

    这恰好是fa处的Jacobi矩阵,我们将其记为Df(a)。下面的逆映射定理指出,一点处的切映射可以确定该点处局部的拓扑性质
  • (逆映射定理)如果f: U \to VC^1映射,并且Df(a)可逆,那么fa处局部为C^1微分同胚
    • 我们需要寻找a的开邻域U' \subset U,使得

          \[ f|_{U'}: U' \to f(U') \]

      C^1微分同胚。关键在于证明f(U')为开集,我们需要对任意固定的y,求解非线性方程

          \[ y = f(x). \]

      在数值计算中,我们使用迭代方法求解非线性方程,比如不动点定理。在从不动点定理到编程语言中,我们需要弱完备空间的连续映射,或者强完备空间的递增映射;在完备度量空间中,我们需要完备度量空间的压缩映射
    • 将上述方程转化为不动点方程

          \[ x = \phi_y(x) = x + Df(a)^{-1}[y - f(x)], \]

      然后取U'a的凸的开邻域,满足

          \[ ||D\phi_y(x)|| = ||I - Df(a)^{-1}Df(x)|| \leq \frac 12,\; x \in U'. \]

      对线段\overline{x_1x_2} \subset U'使用微分不等式,可得

          \[ ||\phi_y(x_1) - \phi_y(x_2)|| \leq \frac 12||x_1 - x_2||. \]

      下面我们证明f|_{U'}C^1微分同胚
    • f|_{U'}为双射
      • 只需证明f|_{U'}为单射,如果f(x_1) = f(x_2) = yx_1x_2 \in U',那么

            \[ ||x_1 - x_2|| = ||\phi_y(x_1) - \phi_y(x_2)|| \leq \frac 12||x_1 - x_2||. \]

        因此,x_1 = x_2
    • f(U')为开集
      • y_0 = f(x_0)任意固定,其中x_0 \in U'。那么,

            \begin{equation*}\begin{split}  ||\phi_y(x_0) - x_0|| &= ||x_0 + Df(a)^{-1}[y - f(x_0)] - x_0|| \\ &\leq ||Df(a)^{-1}|| \cdot ||y - y_0||.  \end{split}\end{equation*}

      • rs > 0满足

            \[ \overline{B_r(x_0)} \subset U',\; s \leq ||Df(a)^{-1}||^{-1} \cdot \frac 12r. \]

        那么,对任意x \in \overline{B_r(x_0)}y \in B_s(y_0),我们有

            \begin{equation*}\begin{split}  ||\phi_y(x) - x_0|| &\leq ||\phi_y(x) - \phi_y(x_0)|| + ||\phi_y(x_0) - x_0|| \\ &\leq \frac 12||x - x_0|| + ||Df(a)^{-1}|| \cdot ||y - y_0|| \\ &\leq \frac 12r + \frac 12r = r.  \end{split}\end{equation*}

      • 由此可知,对任意y \in B_s(y_0)\phi_y: \overline{B_r(x_0)} \to \overline{B_r(x_0)}为完备度量空间的压缩映射。由不动点定理,存在p \in \overline{B_r(x_0)}使得

            \[ p = \phi_y(p) = p + Df(a)^{-1}[y - f(p)]. \]

        y = f(p)。因此,B_s(y_0) \subset f(U')f(U')为开集
    • g = (f|_{U'})^{-1}C^1映射
      • 我们使用差分xx + \Delta x \in U',以及

            \[ f(x) = y,\; f(x + \Delta x) = y + \Delta y. \]


            \[ ||\Delta x - Df(a)^{-1}\Delta y|| = ||\phi_y(x + \Delta x) - \phi_y(x)|| \leq \frac 12||\Delta x||, \]

        可得||\Delta x|| \leq C||\Delta y||,即gC^0映射
      • f为可微映射,当||\Delta x|| \leq \delta时,我们有

            \[ ||f(x + \Delta x) - f(x) - Df(x)\Delta x|| \leq \epsilon \cdot A \cdot ||\Delta x||, \]

        其中,A = ||Df(x)^{-1}||^{-1} \cdot C^{-1}。下面,我们需要进一步取U',使得Df在整个U'上可逆。当||\Delta y|| \leq \delta \cdot C^{-1}时,我们有||\Delta x|| \leq \delta,并且

            \begin{equation*}\begin{split}  &\mathrel{\phantom{=}}  ||g(y + \Delta y) - g(y) - Df(x)^{-1}\Delta y|| \\ &= ||\Delta x - Df(x)^{-1}[f(x + \Delta x) - f(x)]|| \\ &\leq ||Df(x)^{-1}|| \cdot ||f(x + \Delta x) - f(x) - Df(x)\Delta x|| \\ &\leq ||Df(x)^{-1}|| \cdot \epsilon \cdot A \cdot ||\Delta x|| \\ &\leq \epsilon \cdot ||\Delta y||.  \end{split}\end{equation*}

        g为可微映射,并且

            \[ Dg(y) = Df(x)^{-1}. \]

      • fC^1映射,可得gC^1映射,这可以由Dg的表达式得到,

            \[ Dg: y \mapsto x \mapsto Df(x) \mapsto Df(x)^{-1}. \]

  • 逆映射定理对于C^r1 \leq r \leq \infty也成立。如果fC^r映射,那么g也是C^r映射,这可以由Dg的表达式、数学归纳法得到