综合微分几何 (1) 无穷小与微分 [SDG-1-D]

讲义
SimplicialCat

综合微分几何是将综合数学 (synthetic mathematics) 的思想应用于微分几何的结果. 本文参考 A. Kock 的奠基性作品 Synthetic Differential Geometry, 以及 R. Lavendhomme, Basic Concepts of Synthetic Differential Geometry.

按照我目前的理解, 综合数学的出发点不是一个对象怎样构造, 而是它应当满足什么性质. 当然我们最终还是需要给出一个构造 (模型).

以下引用框中的内容是我的评注. 评注可能不准确, 初学者不妨跳过.

本文的前置知识是基础的微积分.

直线的结构

综合微分几何的基础是直线 $R$. $R$ 上的点也称为数, 数可以相加减, 相乘, 但不一定可以相除. 使用 $R$ 这个字母是为了让人联想起经典几何中使用的实数域 $\mathbb{R}$. 之所以不规定数可以相除, 是因为我们希望 $R$ 中存在这样一些元素, 它不是 $0$, 但它的平方等于 $0$. 这就是所谓无穷小.

初学者可以跳过这段评注 (下面我们将省略这句话). $R$ 是一个意象 (topos) $\mathcal E$ 中的环对象. 意象是一种性质类似于集合范畴的范畴, 其中有一种内语言 (internal language) 使得我们可以 “假装” 所谈论的对象是集合, 而态射是集合的映射. 综合微分几何从头到尾都使用这种语言. 特别地, 我们可以 “假装” $R$ 是一个普通的环. 另外, 以下我们将用 “空间” (甚至 “集合”) 来指 $\mathcal E$ 的对象, “(光滑) 映射” 指 $\mathcal E$ 的态射.

综合微分几何一个重要的对象是 “原点的无穷小邻域” $D$. 定义 $$ D = \{x \in R \colon x^2 = 0\}. $$ $D$ 中的元素是那些 “如此小以至于其平方等于零” 的数.

由定义, $D$ 有如下的性质.

$D$ 关于数乘封闭: 对任意 $d\in D$, $x\in R$, 有 $d\cdot x \in D$.
$D$ 关于加法不封闭: 对于 $d_1,d_2\in D$, $d_1+d_2$ 落在 $D$ 中当且仅当 $d_1d_2 = 0$.

$D$ 的定义式的实际含义如下. 由环对象的定义我们有乘法映射 $\mu \colon R\times R \to R$ 与 “零元” $0_R \colon 1 \to R$. 记 $\Delta \colon R \to R \times R$ 为对角映射. 考虑映射 $0 = 0_R \circ 1$ 以及平方映射 $(-)^2 = \mu \circ \Delta$. $D$ 是两个映射 $0$ 与 $(-)^2$ 的等化子 (equalizer). 另外, 借用代数几何的语言, 我们可将之记为 “仿射 $R$-概形” $\operatorname{spec}_R(R[x]/(x^2))$.

对于一条曲线, 当我们观察它很小的局部, 它近乎是一条直线. 对于一个函数, 当我们观察它在无穷小邻域 $D$ 上的行为, 它近乎是线性函数. 我们需要一条公理来表达这种直观.

公理 (Kock–Lawvere). 对任意映射 $f \colon D \to R$, 存在唯一的 $a,b \in R$, 使得 $$ f(d) = a + d \cdot b,\quad \forall d\in D. $$

换言之, $D$ 是如此之小, 以至于 $D$ 到 $R$ 的任何映射都是一次函数; 换言之, 可延拓为 $R$ 到 $R$ 的一次函数. 后面我们将简记这条公理为 K-L 公理.

如下的例子或许可帮助理解 $D$ 的形状.

例. 平面 $R^2$ 上的直线 $y=0$ 与圆 $x^2 + (y-1)^2 = 1$ 的交集是 $D$. 这是因为将 $y=0$ 代入圆的方程, 就得到 $x^2 + 1 = 1$, 也即 $x^2 = 0$. 直观上, 直线与圆相切, 两者在相切处共有一条无穷小的线段. 更一般地, 任意两条相切的曲线都共有一条形如 $D$ 的无穷小线段, 这便是两条曲线共同的切向量.

K-L 公理可理解为一阶 Taylor 公式.

定理 (一阶 Taylor 公式). 对任意映射 $f \colon R \to R$, 存在映射 $f' \colon R \to R$ 满足 $$ f(x+d) = f(x) + d \cdot f'(x),\quad \forall x\in R\,\forall d\in D. $$ 称 $f'$ 为 $f$ 的导函数. 我们发现, “任何函数都是可导的”, 而且可以归纳地定义 $k$ 阶导数 $f^{(k)}(x)$.

成熟的读者可能感到逻辑上的不适. 这是因为, 为了研究综合微分几何, 我们采用一种没有排中律的直觉主义逻辑, 即意象 $\mathcal{E}$ 的内语言. 本文并非逻辑完整的, 但读者可考虑如下的例子来体会. 假若排中律成立, 我们就可以定义显然不可导的函数 $f(x) = \begin{cases} 1 & x = 0\\0 & x\neq 0 \end{cases}$, 而且存在 $d_0 \in D$ 使得 $d_0 \neq 0$, 那么 $0 = f(d_0) = f(0) + d_0 f'(0) = 1 + d_0$, 这导致 $1=0$.

定理 (Leibniz 法则). 对任意映射 $f,g \colon R \to R$, $(fg)' = f'g + fg'$.

这是因为对任意 $d\in D$, $$ \begin{aligned} &f(x+d)g(x+d)\\ &= (f(x) + d\cdot f'(x)) (g(x) + d\cdot g'(x))\\ &=f(x)g(x) + d\cdot (f'(x)g(x) + f(x)g'(x)). \end{aligned} $$ (注意由于 $d^2 = 0$, 二阶项消失了.)

高阶 Taylor 公式需要高阶无穷小邻域. 定义 $$ D_k = \{ x \in R \colon x^{k+1} = 0 \}. $$

类似地, $D_k = \operatorname{spec}_R(R[x]/(x^{k+1}))$.

很明显我们有包含关系 $\{0\} \subset D \subset D_2 \subset D_3 \subset\cdots$. 直观上, 更大的无穷小邻域能够体现更高阶 Taylor 展开的信息. 为了表达这种直观, 我们需要配套的公理.

公理. 对任意映射 $f \colon D_k \to R$, 存在唯一的 $a_0, \cdots, a_k \in R$ 使得 $$ f(x) = a_0 + a_1 d + \cdots + a_k d^k,\quad \forall d\in D_k. $$

换言之, $D_k$ 到 $R$ 的映射可唯一地延拓为 $R$ 上不超过 $k$ 次的多项式映射.

定理 (Taylor 公式). 对任意映射 $f \colon R \to R$, $$ f(x+\delta) = f(x)+\delta f'(x)+\cdots+ \frac{\delta^k}{k!}f^{(k)}(x),\,\forall \delta\in D_k. $$

讨论完了一元微分学, 我们进入二元微分学. 对任意函数 $f \colon R^2 \to R$, 如下定义 $\dfrac{\partial f}{\partial x_1}$: 对 $d\in D$, $$ f(x_1+d,x_2) = f(x_1,x_2) + d\cdot \frac{\partial f}{\partial x_1}(x_1,x_2) $$ 若 $f$ 仅在一个区域 $U \subset R^2$ 上定义, 那么 $\dfrac{\partial f}{\partial x_1}$ 的定义域是 $\{(x_1,x_2) \colon (x_1+d,x_2)\in U\,\forall d\in D\}$.

对两个量 $d_1,d_2 \in D$, $$ \begin{aligned} &f(x_1+d_1,x_2+d_2)\\ &= f(x_1,x_2) + d_1 \frac{\partial f}{\partial x_1}(x_1,x_2) + d_2 \frac{\partial f}{\partial x_2}(x_1,x_2) \\&\quad + d_1d_2 \frac{\partial^2 f}{\partial x_1\partial x_2}(x_1,x_2). \end{aligned} $$ 由此, 偏导是交换的.

“无穷小方块” $D\times D \subset R^2$ 满足如下 “性质 W”. 对任意 $f \colon D\times D \to R$, 假设 $f(0,d) = f(d,0) = 0\,\forall d\in D$, 则存在唯一的 $t \in R$, 使得 $$ f(d_1,d_2) = td_1d_2\quad \forall d_1,d_2\in D. $$

“性质 W” 中的 W 代表 Weil 代数, 也即 $R[x_1,\cdots,x_n]/(f_1,\cdots,f_m)$.

让我们思考这样一个问题. 二维平面 $R^2$ 中原点的 “一阶无穷小邻域” 是 $D\times D$ 吗?

所谓一阶无穷小邻域就是一个 “很小” 的邻域, 以至于其上的函数有且只有一次函数. 但是我们看到, $D\times D$ 上不仅有一次函数, 还可能存在着 $f(d_1,d_2) = d_1d_2$ 这样的函数.

这启发我们, 那个一阶无穷小邻域不是 $D\times D$, 而是 $$ \{(x,y)\in R^2 \colon x^2=y^2=xy=0\}. $$ 我们把它记作 $D(2)$. 很明显, $D(2)$ 包含于 $D\times D$.

对 “自然性” 敏感的读者会注意到, $D(2)$ 的内蕴刻画是其上任意两个线性函数的乘积都消失, 因此它不依赖于坐标, 也即在线性同构下不变 — 这也是它有资格作为一阶无穷小邻域的原因之一.

自然地, $R^n$ 中原点的一阶无穷小邻域就是 $$ D(n) = \{(x_1,\cdots,x_n) \in R^n \colon x_ix_j = 0\forall i,j\}. $$

可以设想, 高维空间中会有更复杂的无穷小邻域 $\operatorname{spec}_R\big(R[x_1,\cdots,x_n]/(f_1,\cdots,f_m)\big)$, 以及配套的性质 W. 这里暂略.