2026-02-13
碎碎念. 这篇文章是关于数学的, 但实在太难说它本身是数学, 姑且贴上个 “非数学” 的标签, 以免受人诟病——即便身负数学严格性的重担的人, 当然也是有资格写 “非数学” 散文的. 我写这篇文章的主要目的是为综合数学 “正名”. 但它并未被 “打倒” (实则是并未被关注), 故谈不上真正的正名; 它只是在我个人的经历中, 在登上大雅之堂的途中受到了一点阻碍, 并且消磨了我对它的热情; 而随着阅历更加丰富, 我在对几篇笔记的偶然反刍之下, 对它产生了新的见解, 不得不记录下来, 好给过去与未来的自己一个交代. 但我写这篇文章的理由未必是读者读这篇文章的理由; 站在读者的立场, 这些事情就不必赘述了.
我打算不以综合数学的玄而又玄的讨论来开启这篇文章, 而是谈论些众所周知的事情. ——我们来谈论抽象代数的起源. 我们的目的不是复原历史的脉络, 而是从现代人的视角来反思抽象代数这个学科存在的理由, 然后对这个理由作一种合理的演绎 (如文章的题目所示, 这种演绎叫做范畴化), 来得到综合数学这门学科存在的理由, 这便是我想要记录的新的见解.
所谓代数最初即是在数的运算中, 用符号来代替数的做法. 它最初仅仅是一个从特殊到一般的过程——我们发现
$$
(3+5)^2 = 3^2 + 2\cdot 3\cdot 5 + 5^2,
$$
$$
(4+6)^2 = 4^2 + 2\cdot 4\cdot 6 + 6^2,
$$
于是我们用符号代替一些具体的元素, 写成如下形状的公式,
$$
(a+b)^2 = a^2 + 2ab + b^2,
$$
来表达对任何数普遍成立的规律.
然而随着数学的成熟, 一个细微的观念转变发生了——它是如此细微, 以至于学习现代数学多年的读者们可能都忘了这是一场变革: 用来表示 “一般元素” 的符号 $a,b$, 可以不再表示任何一个具体的元素, 而是变成了完全抽象的, 但仍旧遵循同样规律的东西. 我们开始操作带有这些抽象符号 $a,b$ 的等式, 而不在乎符号之下的内涵, 或者说真正的内涵已经不在那里了: 我们从对具体元素的研究转向了对规律本身的研究.
于是, “代数” 的概念产生了. 一个代数是一些元素的集合, 元素之间可作加法, 乘法等运算, 满足交换律, 结合律, 分配律等性质. 如果仅研究这些运算的规律, 而不依赖于参与运算的元素具体的构造, 那么我们作出的论证就适用于任何一个代数. (若读者有微分几何的相关经验: 这就像是微分几何中若不使用坐标进行计算, 那么计算的结果就适用于任何坐标.) 放弃对一个锚定的具体事物的追求, 反而换来了特殊化到所有具体事物的机会.
学习现代数学多年的读者们, 可能难以体会 “代数” 这样的概念对一个仅学过实数的运算的人有多么陌生.
困难并不在于人的智力不能理解代数的定义, 而在于他们长久以来的信念的动摇: 原来我所认识的这个数的系统不是唯一存在的, 唯一合理的数的系统; 事实恰恰相反, 这种系统要多少就有多少. 例如在一个代数中, 我们可以随心所欲地加入一个满足指定的代数方程的元素. 回想历史上人们对虚数 $i$ 的引入曾产生多么大的抵触: 在实数中加入一个满足 $i^2 = -1$ 的元素, 而这个方程在实数中没有任何道理.
人们不是不能对这个方程进行运算, 而是不能接受自古以来熟悉的系统, 实数的代数 $\mathbb{R}$, 被外来者污染, 以至于失去它不可撼动的地位.
当然, 现在的人们早已不再对各式各样的代数产生恐慌. 复代数几何的基础 $\mathbb{C}$, $p$-进几何的基础 $\mathbb{Z}_p$, 已经是每一个数学家如数家珍的代数对象. 人们研究的代数中的运算也不断丰富, Lie 代数, Poisson 代数, Hopf 代数, … 这些结构在各自的领域中发光发热.
总结从研究实数的运算到研究抽象代数发生的观念转变:
- 一个代数是一个带有结构的集合, “实数” 不过是那个特殊的代数 $\mathbb{R}$ 的元素;
- 通过四则运算, 我们不仅是在研究实数的规律, 而且可以研究任何代数中的规律, 不依赖于这些集合中元素的具体形式.
现在提升一个范畴层级, 看看集合范畴 $\mathsf{Set}$ 的性质. 它不是一个赤裸的范畴, 正如 $\mathbb{R}$ 不是一个赤裸的集合. 它的对象 (也就是集合) 之间有加法 $+$ 和乘法 $\times$ 的运算:
$A+B$ 是两个集合的无交并, 其元素为 $l(a)$ 或 $r(b)$; $A\times B$ 是两个集合的积, 其元素为 $(a,b)$. 加法和乘法都有交换律, 结合律: $A+B\simeq B+A$, $(A+B)+C\simeq A+(B+C)$ 等等. 乘法对加法有分配律: $A\times (B+C) \simeq A\times B + A\times C$. 由此可得
$$
(A+B)^2 \simeq A^2 + 2 \times A\times B + B^2.
$$
很多时候我们对于集合的操作表面上是在操作集合的元素, 实际上是在操作范畴论结构. 例如, 对于映射 $f\colon A\to B$ 以及 $b\in B$, 取出 $A$ 中满足 $f(a) = b$ 的元素 $a$ 构成的集合 $S = \{a\in A\mid f(a) = b\}$, 实际上是在做范畴论中名为拉回的操作:
$$
\begin{array}
{ccc}
S & \to & 1\\
\downarrow & & \downarrow\\
A & \underset{f}{\to} & B.
\end{array}
$$
由此可见, 只要一个范畴中具有拉回, 那么 $\{a\in A\mid f(a) = b\}$ 这样的表达式就有意义, 而不需要对象 $A$ 真的是由一个一个的元素组成.
任意量词 $\forall$ 和存在量词 $\exists$ 也不是只在集合范畴中有意义. 它们分别是依值积, 依值和的特例, 而这两者分别是拉回操作 $\mathcal{C}_{/Y} \to \mathcal{C}_{/X}$ 的左右伴随. (更一般地, 每种类型论都有与之相应的范畴论结构. 见三位一体.)
经过如此多的铺垫, 如果我现在告诉读者, 我们自古以来熟悉的这个集合范畴, 并不是唯一存在的, 唯一合理的 “集合的范畴”, 我们使用的数学语言描述的不一定是集合, 而可能是任何适当结构的范畴的对象, 不知读者是否还会像只熟悉实数的古人见到虚数那样感到恐慌.
更关键的是, 就像在抽象代数中我们不需要关心集合中的元素的具体构造一样, 在综合数学中我们不需要关心范畴中的对象的具体构造, 这便是综合数学的核心观念; 这种观念无非是抽象代数的核心观念的一次范畴化.
将集合范畴 $\mathsf{Set}$ 的性质抽象出来, 得到一种允许通常数学语言在其中获得语义的范畴的概念, 这就是意象.
在以意象理论为主要表现方式的综合数学中,
- 一个意象是一个带有结构的范畴, “集合” 不过是那个最基本的意象 $\mathsf{Set}$ 的对象;
- 通过一阶逻辑, 我们不仅是在研究集合的规律, 而且可以研究任何意象中的规律, 不依赖于这些范畴中对象的具体形式.
我们认为的 “带结构的集合”, 不过是最基本的意象 $\mathsf{Set}$ 中的结构; 而同样的结构发生在任何一个意象中.
换言之, 随着范畴层级的提升, 我们发现自己从那个 “思想开放” 的 “现代人”, 变成了 “抱残守缺” 的 “古人”.
综合数学的一个出现较早的分支是综合微分几何. 它的理论是这样建立的: 首先规定存在一个对象, 称为直线 $R$; 它具有 $0,1$, 加法和乘法, 构成一个代数. 定义一阶无穷小线段 $D$ 是 $R$ 中平方为零的元素的 “集合”
$$
D = \{x\in R \mid x^2 = 0\}.
$$
一条重要的公理是: 对任意函数 $f\colon D\to R$, 存在唯一的 $a,b\in R$ 满足对任意 $d\in D$, 有 $f(d) = ad+b$. 对任意 “集合” $M$, 定义其切向量为映射 $v\colon D \to M$; 定义 $M$ 的切丛为 $M^D \to M,v\mapsto v(0)$. 微分几何最重要的概念就这样产生了.
如果认为上述理论谈论的是普通的集合范畴, 就会发现它简直是天方夜谭. 实直线上平方为零的元素只有 $0$, 又怎能表达切向量这样的概念呢? 感兴趣的读者可以进一步阅读综合微分几何讲稿. 结论是, 我们应当认为综合微分几何谈论的是一种满足特定条件的意象中的对象. 综合数学的每一个分支, 都可视为对所讨论的意象作某种约束. 任何一个满足约束的意象都可以作为这个学科的模型, 而这个学科所产生的定理在所有模型中同样成立.
我将目前的类比总结成一个表格.
| 范畴层级 | 0 | 1 |
| 对象 | 实数 | 集合 |
| 语言 | 四则运算 | 一阶语言 |
| 全体对象 | 实数的全体 $\mathbb{R}$ | 集合的全体 $\mathsf{Set}$ |
| 抽象概念 | 代数 = 带结构的集合 | 意象 = 带结构的范畴 |
| 约束 | 代数方程 | 公理 |
表格有没有可能向右延申? 有没有可能, 范畴的 $2$-范畴 $\mathsf{Cat}$ 不是唯一合理的 “范畴的范畴”, 而是所有的范畴论语言都可以在一个 “$2$-意象” 中解读? 这种语言该如何设计? 我不知道.