为什么要互换根:从韦达到五次方程无根式解(高中版)

副标题:从根的互换、韦达定理到伽罗瓦群的通俗讲解

写在前面

这不是一本大学抽象代数教材。它面向高中生和普通数学爱好者,默认你熟悉二次方程、韦达定理、一点排列组合和少量复数。我们不会一开场就抛出域扩张、正规子群、可解群这些词,而是从一个更朴素的问题出发:为什么要研究根的位置互换?

全书会反复使用一个克制的破案比喻:方程的系数像公开线索,根像身份还没确认的嫌疑人,根的位置互换像侦探做的测试,所有合法换位动作的名单后来叫伽罗瓦群,而开根号就是打破某一层不可区分性的工具。

每一章只解决一个核心问题。公式会出现,但不会密集堆砌;每个公式出现时,我们都会问它为什么出现,它解决了什么问题,它和根的互换有什么关系。

目录

  • 序章 一个公式为什么会不存在
  • 第一章 二次方程到底在做什么
  • 第二章 韦达定理:系数看到的只是根的整体
  • 第三章 根的位置为什么要互换
  • 第四章 两个根的互换:最简单的群
  • 第五章 三个根的互换:六个动作的世界
  • 第六章 为什么要研究这些互换动作
  • 第七章 三次方程的三个根为什么更难分开
  • 第八章 三次方程为什么还能用根式解
  • 第九章 四个根的互换更复杂
  • 第十章 从二次、三次、四次方程总结规律
  • 第十一章 五个根有多少种互换
  • 第十二章 $A_5$:根号打不开的核心
  • 第十三章 不是所有五次方程都一样
  • 第十四章 一个具体五次方程的计算例子
  • 第十五章 数学软件是怎么计算伽罗瓦群的
  • 第十六章 尺规作图也是一种“工具限制”
  • 第十七章 为什么不能三等分任意角
  • 第十八章 偏微分方程里也有伽罗瓦理论吗
  • 结语 数学不只是求答案

全书主线地图

全书核心问题可以用一句话概括:为什么二次、三次、四次方程可以用根式解,而一般五次方程不可以?

这条路由十个问题串起来:

  1. 我们为什么会相信方程都应该有公式?
  2. 二次公式里的根号到底在分开什么?
  3. 韦达定理为什么只看见根的整体?
  4. 根的位置互换为什么能测试不可区分性?
  5. 互换动作为什么会组成群?
  6. 开根号为什么等于打破一层对称性?
  7. 三次、四次方程为什么仍然能分层拆开?
  8. 五次方程为什么会遇到 $A_5$ 这个拆不开的核心?
  9. 具体五次方程的伽罗瓦群如何判断?
  10. 这种“先判断能不能,再追求怎么算”的思想还能照亮哪些数学问题?

本书的写法遵循一个原则:先讲问题,再讲概念;先讲例子,再给名称。读者不需要一开始就懂群论,只需要愿意跟着二次方程、韦达定理和根的互换一步步往前走。

序章 一个公式为什么会不存在

本章引言

我们从一个很自然的疑问开始:为什么二次方程有求根公式,三次、四次方程也有,而一般五次方程却没有通用根式公式?这不是一个“还没找到”的故事,而是一个“为什么不可能”的故事。

我们从小相信方程应该能解

如果你从小学到高中一路学数学,很容易形成一种很朴素的信念:题目既然出了,就应该有答案;方程既然写下来了,就应该能解出来。一次方程不用说,移项、除以系数就行。二次方程虽然复杂一点,但老师会给出一个漂亮的公式,仿佛只要把系数放进机器,两个根就会自动滑出来。

这种经验很强大。它会让我们以为,数学里的困难主要是“算得够不够熟”。二次方程的公式短一点,三次方程的公式长一点,四次方程的公式更长一点,那么五次方程是不是只需要一个更长、更吓人的公式?如果有人说“五次方程没有通用求根公式”,我们的第一反应往往是:是不是还没有人找到?

可是数学最有意思的地方,正是在这里拐弯。五次方程的问题不是公式太长,而是公式这种工具本身遇到了边界。更准确地说,一般五次方程没有只用四则运算和开根号写出的通用公式。它有根,数值上也能近似求出,但不能像二次公式那样用一套根式表达全部解决。

什么叫“根式公式”

这里先把话说清楚。所谓根式公式,就是从方程的系数出发,只允许做有限次加、减、乘、除,再加上开平方、开立方、开四次方这类开根号操作,最后得到根的表达式。二次公式就是最典型的根式公式:

$$x=\frac{-b\pm\sqrt{b^2-4ac}}{2a}.$$

这个公式里只有四则运算和一个平方根,所以它是根式公式。三次方程和四次方程也有根式公式,只是写出来很长,不适合放在黑板上让人背。到了五次方程,问题不是公式太丑,而是一般情形下这样的公式不存在。

这里的“一般”也很重要。比如 $x^5-1=0$ 当然可以解,$x^5-32=0$ 也不神秘。特殊方程可能有特殊结构,就像案件里突然多了一条清楚的监控录像。但一般五次方程没有这些额外线索。我们要讨论的,是能不能给所有一般五次方程一套统一的根式求解方法。答案是否定的。

不是没有根,而是没有这种表达方式

“没有通用根式公式”很容易被误听成“没有根”。这两件事完全不同。代数基本定理告诉我们,在复数范围内,一个五次多项式如果最高次项系数不为零,就有五个复根,当然要把重根按重数计算。也就是说,根是存在的。

而且,在计算机上我们也可以把根算到很多位小数。数值方法很强大,它可以告诉你某个根大约是多少。可是数值近似不是根式公式。根式公式要求的是一种精确表达,像二次公式那样,从系数出发,用有限次规定操作写出根。

这就像问“这座山能不能到达”和“能不能只走楼梯到达”不是同一个问题。五次方程的根在那里,数值方法可以靠近它;但如果你规定工具只能是四则运算和开根号,那么一般情况下路就断了。

本书真正要回答的问题

本书不打算把五次方程无根式解写成一堆大学代数定义。那样当然严谨,却会让高中读者在入口处就迷路。我们换一条路:从你已经熟悉的二次方程和韦达定理出发,慢慢追问一个奇怪但关键的问题:为什么解方程要研究“根的位置互换”?

这个问题一开始不像求根问题。根都还没算出来,为什么先研究它们怎么换位置?可是伽罗瓦思想的精彩之处就在这里。方程的系数能看见一些信息,却看不见每个根的身份。只要某些根互换后,系数看到的东西完全没变,我们就说明这些根在当前信息下仍然不可区分。

于是,解方程就不再只是“把根算出来”,而是“逐步增加信息,让根之间越来越能被区分”。开根号的作用,也不只是制造一个新数字,而是打破一层对称性。二次、三次、四次方程之所以能解,是因为这种对称性可以一层层打破;五次方程之所以失败,是因为一般情形下会遇到一个拆不开的结构。

本章小结

这一章只推进了一个核心问题:我们从一个很自然的疑问开始:为什么二次方程有求根公式,三次、四次方程也有,而一般五次方程却没有通用根式公式?这不是一个“还没找到”的故事,而是一个“为什么不可能”的故事。如果把它放回全书主线,就是在问:系数给了我们什么线索,根之间还剩哪些不可区分性,新的工具又打破了哪一层对称。

第一章,我们先回到最熟悉的二次方程,看看那个看似普通的根号到底在做什么。

第一章 二次方程到底在做什么

本章引言

二次方程是全书最好的入口。它熟悉得几乎让人放松警惕,但如果换一种眼光看,二次公式已经悄悄展示了根式解的核心动作:用平方根把两个根分开。

那个熟悉的公式,其实藏着一个动作

一元二次方程写成

$$ax^2+bx+c=0quad(a\ne0)$$

时,它的求根公式是

$$x=\frac{-b\pm\sqrt{b^2-4ac}}{2a}.$$

高中课堂上,我们常把这个公式当成计算工具:代入 $a,b,c$,算出判别式,再根据正负判断实根个数。这个用法当然重要,但它不是本书最关心的角度。我们要问的是:公式为什么长成这样?尤其是,为什么里面会出现一个平方根,还有一个 $\pm$?

把公式拆开看,$-b/(2a)$ 像是两个根的中点,$\sqrt{b^2-4ac}/(2a)$ 像是从中点向两边分开的距离。也就是说,二次公式并不是随便把符号堆在一起。它先找到“两个根共同围绕的中心”,再用平方根告诉我们从中心往哪两个方向走。

平方为什么会把两个方向压在一起

平方运算有一个特点:它会把正负两个方向压成同一个结果。比如 32=9, (-3)2=9。当我们只知道某个数的平方等于 9 时,我们不能只说这个数是 3,也不能只说它是 -3。我们必须写成 $\pm3$。

二次方程里出现平方根,根本原因就在这里。配方法把二次方程变成类似

$$(x-h)^2=k$$

的形式。这个式子告诉我们,$x$ 距离 $h$ 的平方是 $k$。可平方看不见方向,于是开平方时必须把两个方向重新放出来:

$$x-h=\pm\sqrt{k}.$$

这就是二次方程有两个根的直观来源。它不是公式硬塞给我们的,而是平方运算本身造成的:平方把两个方向合并,开平方再把它们分开。

判别式不只是判断实根个数

判别式

$$\Delta=b^2-4ac$$

在高中里常用来判断实根个数:$\Delta>0$ 有两个不等实根,$\Delta=0$ 有两个相等实根,$\Delta<0$ 没有实根但有两个复根。这个判断没有错,但本书要多看一层。

如果两个根是 $x_1,x_2$,那么可以算出

$$(x_1-x_2)^2=\frac{b^2-4ac}{a^2}=\frac{\Delta}{a^2}.$$

这句话非常有意思。判别式其实和两个根的差有关。根的和、根的积会在交换两个根时保持不变,但 $x_1-x_2$ 一交换就变成 $x_2-x_1$,也就是变号。于是,$x_1-x_2$ 是一个能区分两个根的东西,而它的平方又回到了系数能看见的世界。

所以,开平方的动作不是装饰。它把“差的平方”变成“差本身”,也就把两个根真正分开了。

二次方程给人的错觉

二次方程太顺利了。它告诉我们:遇到方程,配方,开平方,答案出来。这个经验很容易让人产生错觉,以为高次方程也只是同一套操作的升级版。三次开立方,四次再绕一下,五次大概也能继续。

可是从伽罗瓦的眼光看,二次方程之所以简单,是因为它只有两个根,两种可能的互换:不动,或者交换。开一个平方根,就足以把这层不确定性处理掉。它像一扇很轻的门,推一下就开了。

后面的方程不是简单地“门更重”。三次方程开始出现六种互换,四次方程有二十四种,五次方程有一百二十种。真正的问题慢慢变成:这些互换动作能不能被根号一层层拆开?二次方程给了我们信心,但也给了我们错觉。

本章小结

这一章只推进了一个核心问题:二次方程是全书最好的入口。如果把它放回全书主线,就是在问:系数给了我们什么线索,根之间还剩哪些不可区分性,新的工具又打破了哪一层对称。

下一章,我们不再盯着公式本身,而去看韦达定理:系数究竟看见了根的什么信息。

第二章 韦达定理:系数看到的只是根的整体

本章引言

韦达定理通常被当作解题技巧,但在这本书里,它是通向伽罗瓦思想的第一扇门。它告诉我们:系数看到的不是根的名字,而是根组成的整体关系。

两根之和与两根之积

设二次方程

$$ax^2+bx+c=0$$

有两个根 $x_1,x_2$。韦达定理告诉我们:

$$x_1+x_2=-\frac{b}{a}, \quad x_1x_2=\frac{c}{a}.$$

这两条公式看起来很普通,可它们有一个共同特点:如果把 $x_1$ 和 $x_2$ 交换,结果完全不变。$x_1+x_2$ 变成 $x_2+x_1$,还是原来的和;$x_1x_2$ 变成 $x_2x_1$,还是原来的积。

这说明系数给出的信息有一种天然的“看整体”的倾向。它知道两个根加起来是多少,乘起来是多少,却不关心谁站在第一位,谁站在第二位。

三次方程里同样如此

三次方程也一样。设

$$ax3+bx2+cx+d=0$$

的三个根是 $x_1,x_2,x_3$,韦达关系是

$$x_1+x_2+x_3=-\frac ba,$$

$$x_1x_2+x_1x_3+x_2x_3=\frac ca,$$

$$x_1x_2x_3=-\frac da.$$

这三条关系都不害怕根换位置。你把三个根重新排列,第一条仍然是三个根的总和,第二条仍然是两两乘积的总和,第三条仍然是总乘积。系数像一个只看统计表的人,它知道总分、两两合作分、总合作分,却不知道每个人的座位。

对称性的第一种直觉

现在我们终于可以说出一个词:对称性。这里不需要把它讲得很抽象。所谓对称,就是你做了某种改变以后,某个东西仍然不变。把正方形旋转九十度,它看起来还是原来的正方形;把两个根换位置,根的和与积还是原来的和与积。

韦达定理正是在告诉我们,方程的系数是根的对称信息。系数不是任意地和根有关,而是只通过那些不怕换位置的组合和根发生联系。

这件事非常关键。因为如果已知信息都是对称的,那么根的个体身份一开始就是模糊的。我们不是拿着每个根的照片在破案,而是拿着一堆整体线索:总和是多少,总乘积是多少,某些组合是多少。

为什么这会通向互换根

一旦明白系数只看整体,互换根就不再奇怪。假设有两个嫌疑人,公开线索只说“他们年龄之和是 30,年龄之积是 216”。你把两个人的名字交换一下,这两条线索不会改变。于是,从线索角度看,他们仍然有某种不可区分性。

方程也是这样。根的名字 $x_1,x_2,x_3$ 只是我们为了说话方便贴上的标签。系数本身并没有告诉我们谁必须叫 $x_1$,谁必须叫 $x_2$。如果交换标签以后,所有已知关系都不变,那么这个交换就是当前信息允许的。

这就是根的位置互换进入故事的原因。它不是为了好玩,而是为了检查:在系数给出的线索下,哪些根仍然分不清?哪些变化不会被发现?

本章小结

这一章只推进了一个核心问题:韦达定理通常被当作解题技巧,但在这本书里,它是通向伽罗瓦思想的第一扇门。如果把它放回全书主线,就是在问:系数给了我们什么线索,根之间还剩哪些不可区分性,新的工具又打破了哪一层对称。

既然系数看见的是整体,而不是每个根的身份,下一章我们就要问:把根的位置互换一下,究竟会暴露什么?

第三章 根的位置为什么要互换

本章引言

这一章专门回答全书标题里的问题:为什么要互换根?答案是:互换根是在测试已知信息能不能区分根。

解方程像破案

我们可以把方程想成一桩案件。系数是案发现场留下的公开线索,根是我们要找的嫌疑人。线索告诉我们一些整体关系,比如两个人身高加起来多少、体重乘起来多少,但没有直接告诉我们每个人是谁。

侦探会做一件事:把可能的人选换一换,看线索是否仍然成立。如果换完以后所有线索都对得上,那么这两个身份在当前线索下还没有被区分。反过来,如果某次交换让线索不再成立,那么侦探就抓到了一条能区分身份的新信息。

根的互换就是这种测试。它不是把根真的移动到哪里去,而是在问:如果我们重新命名这些根,方程已经给出的信息会不会察觉?

合法互换是什么意思

假设一个二次方程的两个根是 $x_1,x_2$。韦达定理给出

$$x_1+x_2=-\frac{b}{a}, \quad x_1x_2=\frac{c}{a}.$$

现在交换两个根。和仍然是原来的和,积仍然是原来的积。只靠这两条系数线索,我们看不出交换发生过。所以,这个交换在当前信息下是“合法的”。

这里的“合法”不是道德意义,也不是人为偏好,而是数学意义:它不改变我们已经承认的所有关系。以后我们讲伽罗瓦群时,所谓合法互换就是这种思想的严格版本。先别急着记名称,先抓住动作:换了位置,已知信息没变。

解方程就是打破不可区分性

如果所有根都完全不可区分,我们就没有真正解出方程。解出方程意味着什么?意味着我们能指出每个根,知道它们分别是什么,而不是只知道整体关系。

从这个角度看,解方程的过程就是不断打破不可区分性。原来两个根只通过和与积联系在一起,开平方以后,我们知道了它们的差;原来三个根能互相轮换,某个预解式出现以后,轮换也被识别出来;原来五个根有庞大的互换世界,若这个世界无法被根号一层层拆开,根式解就走不下去。

这条主线比公式本身更重要。公式只是表面,背后真正发生的事情,是对称性被逐步打破。

为什么现在还不急着讲伽罗瓦群

很多教材会很早定义群、域、域扩张、正规子群。那些概念当然重要,但如果读者还没明白“为什么要研究互换”,这些词就会像突然掉下来的石头。

所以本书选择慢一点。我们先从熟悉的方程出发,看见系数为什么只给对称信息;再看见互换根为什么是在测试不可区分性;然后才把这些互换动作组织成一个系统。到那时,“群”这个词就不是硬背的定义,而是自然需要的名字。

数学概念最好不是先被宣布,而是被问题逼出来。现在,问题已经逼近了:这些互换动作能不能有一套自己的运算规则?

本章小结

这一章只推进了一个核心问题:这一章专门回答全书标题里的问题:为什么要互换根?答案是:互换根是在测试已知信息能不能区分根。如果把它放回全书主线,就是在问:系数给了我们什么线索,根之间还剩哪些不可区分性,新的工具又打破了哪一层对称。

根的互换已经有了意义。下一章,我们先看最小的情况:两个根的两个动作,怎样组成一个小小的数学系统。

第四章 两个根的互换:最简单的群

本章引言

我们第一次正式遇到“群”这个词,但只在最简单的场景里遇到它:两个根,两个动作。

两个动作:不动与交换

两个根 $x_1,x_2$ 能做的换位动作其实只有两个。第一个动作是什么也不做,记作 $e$。第二个动作是交换两个根,记作 $(12)$。

一开始,“什么也不做”看起来不像动作。可是如果你把互换看成一个动作系统,不动动作就非常重要。它像一个基准:做了它以后,一切保持原样。没有这个基准,动作系统就不完整。

交换动作也很简单。$(12)$ 表示把第一个位置和第二个位置交换。对两个根来说,这就是唯一真正改变位置的动作。

交换两次等于不动

现在连续做动作。先交换一次,$x_1$ 和 $x_2$ 换了位置;再交换一次,它们又回到原位。所以

$$(12)^2=e.$$

这个式子不是在算普通数字,而是在算动作。动作也可以“相乘”,意思是先做一个动作,再做另一个动作。两个交换连起来,效果等于不动。

这已经有了一点结构味道:动作可以合成,合成以后仍然在原来的两个动作里;每个动作都能撤销;还有一个不动动作作为基准。

这就是最简单的群

现在我们可以给名字了。像这样一组动作,如果满足几个自然条件:有不动动作,动作可以连续做,做完不跑出这个系统,每个动作都能撤销,那么它就叫一个群。

两个根的互换动作组成的群,通常叫 $S_2$。这里的 $S$ 可以先理解为“所有换位动作的集合”。$S_2$ 只有两个元素:

$$S_2={e,(12)}.$$

这不是为了把简单问题说复杂。相反,它是在给后面的复杂问题找一个最小模型。二次方程的根式解之所以简单,正因为它背后的互换动作系统也简单。

从动作系统回到方程

如果二次方程的两个根在系数眼里可以互换,那么一开始的合法动作就是 $S_2$。当我们开出判别式的平方根,得到能区分 $x_1-x_2$ 的信息时,交换动作就不再能悄悄发生。因为交换会让 $x_1-x_2$ 变号。

于是,合法动作从两个减少到一个,只剩不动。只剩不动意味着根已经被当前信息区分开了。二次方程的求根公式,本质上就是把 $S_2$ 这个小群拆掉。

这句话现在听起来也许还有点新鲜,但它会在后面反复出现:解方程,就是让允许的互换动作越来越少。

本章小结

这一章只推进了一个核心问题:我们第一次正式遇到“群”这个词,但只在最简单的场景里遇到它:两个根,两个动作。如果把它放回全书主线,就是在问:系数给了我们什么线索,根之间还剩哪些不可区分性,新的工具又打破了哪一层对称。

两个根的世界太小,但它已经给了我们样板。下一章,三个根会把这个小系统扩展成六个动作的世界。

第五章 三个根的互换:六个动作的世界

本章引言

三个根比两个根只多一个,但互换动作从两个变成六个。这个小小的跃迁,会让我们第一次看到群的真正性格。

三个根有六种排列

如果有三个根 $x_1,x_2,x_3$,它们的位置排列有

$$3!=6$$

种。对应的互换动作也有六个:什么都不做 $e$,交换两个根的三个动作 $(12),(13),(23)$,以及三个根轮流换位置的两个动作 $(123),(132)$。

这里的 $(123)$ 表示第一个去第二个位置,第二个去第三个位置,第三个回到第一个位置。$(132)$ 则是反方向轮换。它们不是普通数字,而是动作的简写。

六个动作合在一起,叫 $S_3$。

交换与轮换不是一回事

在 $S_3$ 里,三种交换动作和两种轮换动作很不一样。交换两个根会留下一个根不动,比如 $(12)$ 只交换 $x_1,x_2$,$x_3$ 仍在原位。轮换动作则让三个根都移动。

这种差别以后很重要。三次方程的判别式会把六个动作分成两类:一类会让某个差积变号,另一类不会。先不用记“奇置换”“偶置换”这些词,只要记住:六个动作内部已经有了可以区分的类型。

这说明三次方程比二次方程复杂,不只是因为根多了一个,而是因为互换动作之间开始有层次。

动作可以连续做

群最有意思的地方在于动作可以连续做。比如先做 $(12)$,再做 $(23)$,最后得到的效果会等于某个轮换动作。不同教材对“先后顺序”的记法可能不同,但核心思想很简单:动作合成以后,仍然是六个动作之一。

这叫封闭性。你不会因为连续做两次换位,就跑到 $S_3$ 外面去。就像转动一个三角形,转几次以后它仍然和原来的三个顶点对应,不会突然变成四边形。

有了合成,互换动作就不再只是零散列表,而变成一个可以研究的系统。

为什么高中生应该看懂 $S_3$

$S_3$ 是全书非常重要的练习场。它足够小,可以把所有动作列出来;又足够丰富,能显示交换、轮换、分类、合成这些群论味道。

更重要的是,三次方程真的会用到它。三个根在系数眼里一开始可能有六种合法互换。解三次方程,就是想办法把这六种可能一步步减少。开平方先去掉一半,开立方再处理剩下的轮换。

所以,$S_3$ 不是抽象代数的摆设,而是三次方程背后的动作地图。

本章小结

这一章只推进了一个核心问题:三个根比两个根只多一个,但互换动作从两个变成六个。如果把它放回全书主线,就是在问:系数给了我们什么线索,根之间还剩哪些不可区分性,新的工具又打破了哪一层对称。

我们已经看见 $S_3$ 的六个动作。下一章要问:研究这些动作到底如何帮助我们理解解方程?

第六章 为什么要研究这些互换动作

本章引言

这一章把前面的线索收束成全书主线:群越大,根越难区分;群越小,我们知道的信息越多;开根号的作用,是打破一层对称性。

群的大小表示什么

如果一个方程的根有很多合法互换,说明在当前已知信息下,这些根还很难区分。合法互换越多,根的身份越模糊。反过来,如果合法互换越来越少,说明我们掌握的信息越来越能认出根。

最极端的情况是只剩不动动作 $e$。这表示任何非平凡的换位都会改变已知信息。换句话说,每个根都已经被当前知识点名了。

因此,群的大小不是为了吓人,而是在测量不可区分性。

开根号为什么能打破对称性

回到二次方程。只知道判别式 $\Delta$ 时,我们知道的是差的平方;开平方以后,我们得到 $\sqrt{\Delta}$,也就能区分两个方向。平方根把原来混在一起的正负可能分开了。

这件事可以用群的语言说:原来交换两个根是合法的;得到平方根以后,交换会让某个表达式变号,于是它不再合法。群变小了。

开根号不是神秘仪式,而是一种增加信息的方式。每增加一次合适的信息,就可能排除一批原本合法的互换动作。

根式解就是一层层拆群

根式解允许我们反复开根号。每一次开根号,如果选得好,就能打破一层对称性。于是,解方程的过程可以看成:从一个较大的互换群出发,通过不断增加根式信息,让群逐步缩小,直到只剩不动。

二次方程只需要一步。三次方程需要更精巧的两步:先开平方,再开立方。四次方程虽然更复杂,但仍然能分层拆开。

这就是“可用根式解”的真正含义:不是公式好不好看,而是背后的互换动作能不能被根号按层拆掉。

五次方程的阴影

如果所有方程的群都能这样拆,故事就会一路顺利。可五次方程的问题正是:一般情形下,它的互换结构会遇到一个无法继续拆解的核心。这个核心后来叫 $A_5$。

现在不用急着理解 $A_5$。我们先记住问题的形状:根式解需要一串台阶,每个台阶对应打破一层对称;如果某个群不给你这样的台阶,根式解就无法继续。

后面几章,我们会先看三次和四次为什么还有台阶,再看五次为什么突然没有。

本章小结

这一章只推进了一个核心问题:这一章把前面的线索收束成全书主线:群越大,根越难区分;群越小,我们知道的信息越多;开根号的作用,是打破一层对称性。如果把它放回全书主线,就是在问:系数给了我们什么线索,根之间还剩哪些不可区分性,新的工具又打破了哪一层对称。

主线已经搭好。下一章我们把它放进三次方程,看看三个根的六种互换怎样被判别式先分成两半。

第七章 三次方程的三个根为什么更难分开

本章引言

三次方程有三个根、六种互换。它比二次方程难,不只是公式更长,而是根的互换世界第一次出现真正的层次。

三次方程的韦达关系

设三次方程

$$ax^3+bx^2+cx+d=0$$

的根是 $x_1,x_2,x_3$。系数看到的是三个对称组合:

$$x_1+x_2+x_3,$$

$$x_1x_2+x_1x_3+x_2x_3,$$

$$x_1x_2x_3.$$

这三个组合都不怕根换位置。所以,仅凭系数,三个根的身份仍然是模糊的。

六种互换带来的新麻烦

三个根的六种互换组成 $S_3$。二次方程只有交换与不动,而三次方程多出了轮换。轮换不像简单交换那样只让两个根换座位,它会让三个根依次移动。

这让问题复杂得多。即使我们用某个方法区分了“交换类”的动作,仍然可能剩下三个根轮流换位置的可能。也就是说,三次方程需要不止一把钥匙。

这也是为什么三次公式会比二次公式复杂很多。复杂不是凭空来的,它对应着互换结构的复杂。

判别式先砍掉一半

对三个根,可以构造一个差积:

$$D=(x_1-x_2)(x_1-x_3)(x_2-x_3).$$

如果交换两个根,这个差积会变号;如果做三根轮换,它不会变号。可是 $D$ 本身通常不能直接由系数看见,$D^2$ 却可以,它就是三次方程判别式的核心。

于是,开平方得到 $D$,就相当于知道了哪些互换会变号,哪些不会。六个动作被分成两半:会变号的三个,和不变号的三个。后来,不变号的三个动作组成 $A_3$。

从 $S_3$ 到 $A_3$ 的直觉

如果一开始的合法互换是 $S_3$,开平方知道 $D$ 以后,那些会让 $D$ 变号的交换动作就不再合法。剩下的是三个轮换动作:

$$A_3={e,(123),(132)}.$$

这一步和二次方程很像:开平方排除了一批对称性。但三次方程还没结束,因为 $A_3$ 里还有三个动作,不是只剩不动。

所以三次方程告诉我们:开平方能打破一层对称,但不一定打破全部。我们还需要下一步。

本章小结

这一章只推进了一个核心问题:三次方程有三个根、六种互换。如果把它放回全书主线,就是在问:系数给了我们什么线索,根之间还剩哪些不可区分性,新的工具又打破了哪一层对称。

判别式帮三次方程砍掉一半对称性以后,剩下的轮换还没有解决。下一章,我们看开立方和拉格朗日预解式怎样继续推进。

第八章 三次方程为什么还能用根式解

本章引言

上一章我们已经看见,三次方程的三个根一开始有六种互换动作,也就是 $S_3$。判别式的平方根能把这六种动作分成两半,把 $S_3$ 缩到 $A_3$。但这还没有真正解出三次方程,因为 $A_3$ 里还剩三个轮换动作。现在的问题变成:剩下的三重轮换,能不能也用根号打破?答案是能,而且这一步正是卡尔达诺公式背后的真正结构。

先把三次方程整理成更干净的样子

一般三次方程写成

$$ax^3+bx^2+cx+d=0\quad(a\neq0).$$

如果直接处理它,公式会很臃肿。数学家通常先做一个平移,把二次项去掉。令

$$x=y-\frac{b}{3a},$$

原方程就会变成一个没有 $y^2$ 项的三次方程:

$$y^3+py+q=0.$$

这里

$$p=\frac{3ac-b^2}{3a^2},\qquad q=\frac{27a^2d-9abc+2b^3}{27a^3}.$$

这一步看起来只是代数整理,但它有一个直观意义:我们把三个根的“中心”挪到 0 附近。对于去掉二次项后的方程,三个根 $y_1,y_2,y_3$ 满足

$$y_1+y_2+y_3=0.$$

也就是说,总和这条对称信息已经被整理得最简单。接下来真正需要破解的,不是三个根的总和,而是它们怎样彼此区分。

从“总和”走向“带标记的总和”

普通总和

$$y_1+y_2+y_3$$

太对称了。无论三个根怎么轮换,它都不变。它像一条很粗的公开线索,只告诉我们三个人合起来是什么样,却看不出谁坐在哪个位置。

为了看见位置,我们给三个位置贴上三个不同的复数标记。取一个三次单位根 $\omega$,满足

$$\omega^3=1,\qquad\omega\ne1,\qquad1+\omega+\omega^2=0.$$

然后构造两个带标记的表达式:

$$L_1=y_1+\omega y_2+\omega^2y_3,$$$$L_2=y_1+\omega^2 y_2+\omega y_3.$$

这两个式子就是拉格朗日预解式的核心。它们的作用不是直接给出答案,而是让三个根的轮换留下痕迹。普通总和看不出轮换,带 $\omega$ 的总和能看出轮换。

如果把根做一次轮换 $(123)$,$L_1$ 和 $L_2$ 不会乱变,而是只会乘上 $\omega$ 或 $\omega^2$ 这样的因子。于是,当我们看 $L_1^3$ 和 $L_2^3$ 时,这些因子又被三次方消掉:

$$\omega^3=1.$$

这就是关键。轮换会改变 $L_1$,但不会改变 $L_1^3$。所以 $L_1^3$ 有机会回到系数能表达的对称世界里。换句话说,开立方正好对应破解三重轮换。

卡尔达诺公式从哪里来

现在我们换一种更容易计算的写法。对

$$y^3+py+q=0$$

$$y=u+v.$$

代入左边:

$$y^3+py+q=(u+v)^3+p(u+v)+q.$$

展开得到

$$u^3+v^3+(3uv+p)(u+v)+q.$$

这时我们故意安排

$$3uv+p=0,$$

也就是

$$uv=-\frac p3.$$

这样中间那一大块就消失了,方程只剩

$$u^3+v^3+q=0,$$

于是

$$u^3+v^3=-q.$$

现在把

$$U=u^3,\qquad V=v^3$$

看成两个未知量。它们满足

$$U+V=-q,$$

并且

$$UV=(uv)^3=\left(-\frac{p}{3}\right)^3=-\frac{p^3}{27}.$$

这就变成了一个二次问题。两个数 $U,V$ 的和与积已知,所以它们是二次方程

$$Z^2+qZ-\frac{p^3}{27}=0$$

的两个根。用二次公式得到

$$U=-\frac{q}{2}+\sqrt{\frac{q^2}{4}+\frac{p^3}{27}},$$ $$V=-\frac{q}{2}-\sqrt{\frac{q^2}{4}+\frac{p^3}{27}}.$$

于是

$$u=\sqrt[3]{-\frac{q}{2}+\sqrt{\frac{q^2}{4}+\frac{p^3}{27}}},$$ $$v=\sqrt[3]{-\frac{q}{2}-\sqrt{\frac{q^2}{4}+\frac{p^3}{27}}}.$$

所以去二次项后的三次方程有一个根是

$$y=u+v$$

也就是

$$y=\sqrt[3]{-\frac q2+\sqrt{\frac{q2}{4}+\frac{p3}{27}}}+\sqrt[3]{-\frac q2-\sqrt{\frac{q2}{4}+\frac{p3}{27}}}.$$

最后再把 $x=y-b/(3a)$ 换回去,就得到原方程的一个根。

三个根怎样全部印出来

三次方程有三个根,不应该只写一个。因为立方根本身有三个选择:如果 $u$ 是一个立方根,那么

$$u,\quad\omega u,\quad\omega^2u$$

也都是相关的立方根。为了保持 $uv=-p/3$,$u$ 和 $v$ 的选择要配对。最终三个根可以写成

$$y_0=u+v,$$

$$y_1=\omega u+\omega^2v,$$

$$y_2=\omega^2u+\omega v,$$

其中

$$u^3=-\frac{q}{2}+\sqrt{\frac{q^2}{4}+\frac{p^3}{27}},\qquad v^3=-\frac{q}{2}-\sqrt{\frac{q^2}{4}+\frac{p^3}{27}},$$

并且选择 $u,v$ 时保持

$$uv=-\frac p3.$$

原来方程的三个根就是

$$x_k=y_k-\frac{b}{3a}\qquad(k=0,1,2).$$

这就是卡尔达诺公式的一种清楚写法。它看起来仍然不短,但它的结构现在很清楚:先平移去掉二次项,再用平方根解决 $U,V$ 的互换,最后用立方根解决三重轮换。

这一步怎样破解对称性

现在把公式和群的主线接起来。三次方程一开始有六种根的互换,也就是 $S_3$。判别式中的平方根先做一件事:区分会让差积变号的动作和不会变号的动作,把 $S_3$ 缩到 $A_3$。

可是 $A_3$ 还有三个动作:

$$A_3={e,(123),(132)}.$$

这三个动作像一个三格转盘。普通的根的和看不见转盘怎么转,拉格朗日预解式给三个位置贴上 $1,\omega,\omega^2$,于是转动会留下痕迹。再把预解式三次方,轮换带来的 $\omega$ 因子被消掉,表达式回到系数世界。最后,开立方把这个被压缩的信息重新打开。

所以三次公式不是天降魔法。它是在做两次非常明确的工作:

先开平方,打破一半对称性;再开立方,打破剩下的三循环对称性。

本章小结

这一章只推进了一个核心问题:三次方程为什么还能用根式解。答案不是“因为有人算出了一个复杂公式”,而是因为 $S_3$ 的六个互换动作可以分两层拆开。第一层用平方根处理,第二层用立方根处理。

卡尔达诺公式虽然长,但它不是乱的。它的每一块都对应一个破解对称性的步骤:去二次项让总和变简单,二次公式求出 $u3,v3$,立方根再把三重轮换打开。

三次方程还能拆,四次方程更复杂但仍然能拆。下一章,我们去看四个根的最后胜利。

第九章 四个根的互换更复杂

本章引言

四次方程有四个根,最大互换群是 $S_4$,一共有 $4!=24$ 个动作。它比三次方程复杂很多,但它仍然有根式解。原因不是四次公式幸运地被人猜到了,而是四个根的对称性仍然可以分层破解:先把四个根分成两两配对,再解一个辅助三次方程,最后用平方根把每一对里的两个根分开。

先把四次方程压成无三次项的形式

一般四次方程写成

$$ax^4+bx^3+cx^2+dx+e=0\quad(a\neq0).$$

和三次方程一样,我们先做平移,把三次项去掉。令

$$x=y-\frac{b}{4a},$$

方程会变成

$$y^4+py^2+qy+r=0.$$

这里

$$p=\frac{8ac-3b^2}{8a^2},$$$$q=\frac{b^3-4abc+8a^2d}{8a^3},$$$$r=\frac{-3b^4+16ab^2c-64a^2bd+256a^3e}{256a^4}.$$

这个整理的意义和三次方程类似:我们先把四个根的中心挪好。对这个无三次项的方程,四个根 $y_1,y_2,y_3,y_4$ 满足

$$y_1+y_2+y_3+y_4=0.$$

总和已经被整理成最简单的样子。真正要解决的是:四个根怎样分组,组内又怎样分开。

四个根的第一层破解:先找配对

四个根最自然的中间线索,是两两配对。四个对象一共有三种配对方式:

$$(y_1,y_2)\mid(y_3,y_4),$$

$$(y_1,y_3)\mid(y_2,y_4),$$

$$(y_1,y_4)\mid(y_2,y_3).$$

这三种配对是四次方程能被破解的关键。我们不必一开始就认出四个根谁是谁,可以先认出“谁和谁在同一组”。一旦配对被识别,剩下的问题就会变成两个二次方程。

这正符合全书主线:解方程不是一下子点名所有根,而是先找到能减少合法互换的信息。对四个根来说,配对信息会把 $S_4$ 的混乱动作压到更小的范围。

费拉里方法:把四次方程拆成两个二次方程

现在看具体公式。我们希望把

$$y^4+py^2+qy+r$$

分解成两个二次因式:

$$y^4+py^2+qy+r=(y^2+my+n)(y^2-my+l).$$

为什么要这样写?因为右边两个二次因式的 $my$ 和 $-my$ 会互相抵消,所以展开后没有 $y^3$ 项,正好适合无三次项的四次方程。

展开右边:

$$(y^2+my+n)(y^2-my+l)$$

得到

$$y^4+(l+n-m^2)y^2+m(l-n)y+nl.$$

于是我们需要

$$l+n-m^2=p,$$

$$m(l-n)=q,$$

$$nl=r.$$

如果能找到 $m,n,l$,四次方程就拆成了两个二次方程:

$$y^2+my+n=0,$$

$$y^2-my+l=0.$$

每个二次方程都能用平方根解。四次方程的任务,就变成寻找这个拆法。

辅助三次方程从哪里来

$$z=m^2.$$

$$l+n=p+m^2=p+z$$

$$l-n=\frac qm$$

可得

$$l=\frac{p+z+q/m}{2},\qquad n=\frac{p+z-q/m}{2}.$$

再使用 $nl=r$。因为

$$nl=\frac{(p+z)^2-q^2/m^2}{4}=\frac{(p+z)^2-q^2/z}{4},$$

所以

$$\frac{(p+z)^2-q^2/z}{4}=r.$$

两边乘以 $4z$,得到

$$z(p+z)^2-q^2=4rz.$$

展开后就是辅助三次方程:

$$z^3+2pz^2+(p^2-4r)z-q^2=0.$$

这就是四次方程里的关键中间台阶。我们为了破解四个根的配对,先去解一个三次方程。第八章已经告诉我们,三次方程可以用根式解,所以这个 $z$ 也可以用根式得到。

四次方程的根式公式

现在把求根过程完整印出来。

第一步,把原方程化为

$$y^4+py^2+qy+r=0.$$

第二步,解辅助三次方程

$$z^3+2pz^2+(p^2-4r)z-q^2=0.$$

选取一个使后面表达有意义的根 $z$,令

$$m=\sqrt z.$$

如果 $q\ne0$,取

$$
l=\frac{p+z+q/m}{2},
\qquad
n=\frac{p+z-q/m}{2}.
$$

于是四次方程被拆成

$$y^2+my+n=0,$$

$$y^2-my+l=0.$$

所以四个 $y$ 根为

$$y=\frac{-m\pm\sqrt{m^2-4n}}{2},$$

以及

$$y=\frac{m\pm\sqrt{m^2-4l}}{2}.$$

把 $l,n$ 代入,也可以写成

$$y=\frac{-m\pm\sqrt{-2p-z+2q/m}}{2},$$

$$y=\frac{m\pm\sqrt{-2p-z-2q/m}}{2}.$$

最后换回原变量:

$$x=y-\frac{b}{4a}.$$

因此,一般四次方程的四个根可以写成

$$x=-\frac{b}{4a}+\frac{-m\pm\sqrt{-2p-z+2q/m}}{2},$$ $$x=-\frac{b}{4a}+\frac{m\pm\sqrt{-2p-z-2q/m}}{2},$$

其中 $z$ 是辅助三次方程

$$z^3+2pz^2+(p^2-4r)z-q^2=0$$

的一个合适根,$m=\sqrt z$。

如果 $q=0$,原方程变成双二次方程

$$y^4+py^2+r=0,$$

令 $Y=y^2$,先解

$$Y^2+pY+r=0,$$

再开平方即可。这是四次方程中更容易的一种特殊情形。

这套公式怎样破解对称性

现在把费拉里公式翻译回“根的互换”。四次方程一开始有 $S_4$ 的 24 个动作。直接分清四个根很难,于是我们先分清三种配对。三种配对本身形成一个三次问题,所以辅助三次方程出现了。

解出辅助三次方程,就等于知道了正确的配对方式。配对确定以后,四个根被分成两个二次方程。每个二次方程内部只剩两个根的互换,用平方根就能分开。

所以四次方程的根式解不是一口气完成的。它大致经历三步:

先用辅助三次方程识别配对;再用平方根确定每一对的分裂;最后把平移还原回原变量。

这就是 $S_4$ 仍然可拆的直观含义。四次方程复杂,但它的复杂性有楼梯。只要有楼梯,根式公式就能一层层走下去。

本章小结

这一章只推进了一个核心问题:四次方程为什么仍然有根式解。答案是:四个根虽然有 24 种互换,但这些互换可以先通过“三种配对”降到一个辅助三次方程,再通过两个二次方程分开。

费拉里公式很长,但它不是符号堆砌。它先把四次方程变成无三次项形式,再寻找分解成两个二次因式的方法。这个寻找过程逼出一个辅助三次方程;解出辅助三次方程后,剩下的全是平方根。

四次方程是根式公式最后一次普遍成功。下一章,我们把二次、三次、四次放在一起,总结真正的规律。

第十章 从二次、三次、四次方程总结规律

本章引言

在进入五次方程之前,我们停下来整理前三个成功案例。真正的规律不是“公式越来越长”,而是“对称性能不能被根号分层打破”。

二次:一层平方根

二次方程有两个根,最大互换系统是 $S_2$,只有两个动作。开平方得到能区分两个根的差,交换动作被排除,只剩不动。

所以二次方程的根式解可以看成最简单的一次拆解:

$$S_2\longrightarrow {e}.$$

这一步由平方根完成。

三次:平方根再立方根

三次方程有三个根,最大互换系统是 $S_3$,有六个动作。判别式和平方根先把它缩到 $A_3$,也就是三个轮换动作。然后立方根处理这个三循环结构,最终把根区分出来。

它的路线大致是

$$S_3\longrightarrow A_3\longrightarrow {e}.$$

公式很长,但逻辑是分层的。

四次:复杂但仍有台阶

四次方程有二十四个动作。它比三次复杂得多,但仍然能通过配对、辅助三次方程、平方根等工具逐层拆开。

这说明“公式存在”不等于“公式简单”。四次公式复杂到几乎没人愿意背,但它存在,因为背后的群仍然有可拆结构。

真正关键的不是公式长短,而是结构有没有台阶。

一句话总结规律

我们可以把二次、三次、四次的经验压成一句话:根式解要求根的互换群能被根号一层层拆小。

如果能拆,公式也许丑,但存在。如果不能拆,公式再怎么寻找也不会出现。数学家证明五次方程没有通用根式公式,不是因为他们试了很多次失败了,而是因为他们看穿了背后的互换结构。

现在,我们终于可以进入五次方程。

本章小结

这一章只推进了一个核心问题:在进入五次方程之前,我们停下来整理前三个成功案例。如果把它放回全书主线,就是在问:系数给了我们什么线索,根之间还剩哪些不可区分性,新的工具又打破了哪一层对称。

规律已经清楚了:能不能解,取决于群能不能拆。下一章,我们进入五次方程,看看五个根带来的 120 种互换。

第十一章 五个根有多少种互换

本章引言

五次方程的五个根有一百二十种互换。这个数字不是简单的大,而是说明一般五次方程的根拥有极高的不可区分性。

从 5! 开始

五个根的排列数是

$$5!=5\times4\times3\times2\times1=120.$$

如果一个五次方程没有额外特殊关系,它的五个根在系数眼里通常会拥有最大对称性,也就是所有 120 种互换都有可能出现在候选名单里。这个最大互换系统叫 $S_5$。

$S_5$ 是五次方程故事里的大舞台。

一般五次方程为什么默认最大对称

特殊方程可能有额外线索。比如 $x^5-1=0$ 的根是五次单位根,它们有整齐的循环结构,互换不能随便来。但一般五次方程没有这种礼物。

当系数没有提供额外关系时,我们不能凭空排除某些根的互换。于是,最大可能就是 $S_5$。

这和破案很像:如果线索少,嫌疑人之间就更难区分;如果线索多,可能性才会缩小。

判别式还能做什么

和三次方程一样,五次方程也有判别式。判别式和所有根两两差的平方有关:

$$\Delta=\prod_{i<j}(x_i-x_j)^2$$

再乘上与最高次系数有关的因子。它能把置换分成两类:会让差积变号的,和不会变号的。

因此,开判别式的平方根最多能把 $S_5$ 砍到 $A_5$,也就是只剩偶置换。可是问题来了:$A_5$ 还有 60 个动作。

真正的难点还在后面

如果 $A_5$ 像 $A_3$ 那样容易继续处理,五次方程也许还有希望。可它不一样。$A_5$ 的结构非常硬,它不像二次、三次、四次里出现的那些群,能给根号提供一串温和的台阶。

所以,五次方程不是卡在 120 这个数字本身,而是卡在从 $S_5$ 走到 $A_5$ 之后,剩下的 60 个动作无法继续按根式需要的方式拆开。

这就是下一章的核心。

本章小结

这一章只推进了一个核心问题:五次方程的五个根有一百二十种互换。如果把它放回全书主线,就是在问:系数给了我们什么线索,根之间还剩哪些不可区分性,新的工具又打破了哪一层对称。

判别式最多帮我们砍掉一半。真正挡路的是 $A_5$。下一章,我们就来看这个根号打不开的核心。

第十二章 $A_5$:根号打不开的核心

本章引言

上一章我们走到一个关键路口:一般五次方程的五个根,最初可能有 $S_5$ 的 120 种互换。判别式还能帮我们做一件事,把这 120 种互换分成两半,留下 $A_5$ 的 60 种动作。可是到了这里,根式解的道路突然断掉。

这一章要把这个断点讲透。我们暂时不把 $A_5$ 当成一串冷冰冰的符号,而把它想成一个极端对称的物体:正二十面体的 60 种旋转动作。正二十面体有 20 个面、12 个顶点、30 条边。它的旋转对称性非常高,高到什么程度?高到你想从里面找一个“大家都承认的中间小圈子”,几乎完全找不到。

这就是 $A_5$ 被称为五次方程里的“死疙瘩”的原因。它不是大而已,而是太对称、太紧密,内部没有可以让根号继续切开的公开缝隙。

如果你手边正好有一个传统黑白足球,也可以拿足球来讲这一章。严格说,足球不是正二十面体,而是“截角二十面体”:把正二十面体的 12 个顶点削掉,就会出现 12 个五边形和 20 个六边形。可是它保留下来的旋转对称性,正好和正二十面体、正十二面体是同一套,都是 60 种旋转,也就是我们这里说的 $A_5$。

这对小孩特别友好。你可以拿着足球说:看,黑色五边形有 12 个,白色六边形有 20 个,还有很多边。这个球转一转以后,如果图案能严丝合缝地回到原样,那就是一个“合法旋转”。这样的合法旋转一共有 60 个。接下来我们要问:能不能从这 60 个旋转里,公平地挑出一部分,组成一个真正能当“中间台阶”的小圈子?答案就是:不能。

先看成功的拆法长什么样

二次方程的情况最简单。两个根只有两个动作:不动,交换。只知道系数时,交换两个根不会被发现;开出判别式的平方根以后,两个根被分开,交换就不再合法。于是动作名单从

$$S_2={e,(12)}$$

缩成

$${e}.$$

三次方程多一步。三个根有六个动作,也就是 $S_3$。判别式的平方根先区分“会让差积变号的动作”和“不会让差积变号的动作”,于是六个动作变成三个动作:

$$S_3\longrightarrow A_3={e,(123),(132)}.$$

然后,立方根继续处理这三个轮换动作,最后只剩不动。

四次方程更绕,但思路还是一样:先找配对,把四个根分成两组;再把每一组里的两个根用平方根分开。也就是说,二次、三次、四次方程之所以能用根式解,不是因为公式短,而是因为每一步都能找到一个“大家都承认的中间台阶”。

现在问题来了:$A_5$ 里面有没有这样的中间台阶?

子群只是小圈子,正规子群才是公开台阶

先把两个词分清楚。

“子群”可以先理解成大群里的一个小圈子。比如一堆动作里挑出几个动作,如果它们互相连续做,结果仍然在这个小圈子里;每个动作也能在小圈子里找到撤销动作;不动动作也在里面,那么它就是一个子群。它像一个能自给自足的小部门。

但是,根式解需要的不是随便一个小部门,而是一个“公开台阶”。这个台阶必须非常公平:不管你从哪个角度重新命名根,它都还是同一个台阶,不会变成另一个偏心的小圈子。

这就是正规子群的直觉。

可以用公司来想象。大群像一个跨国公司,子群像公司里的一个部门。普通子群只要求这个部门内部能运转。正规子群要求更高:无论总部从哪个国家、哪个视角审查它,它都表现为同一种结构,不能因为换了观察角度就变成另一个部门。

放回正二十面体的旋转里也是一样。假如你的小圈子里有一个动作叫“绕某个顶点旋转”。正二十面体的所有顶点地位完全平等。你不能偏心地只要这个顶点附近的旋转,却不要其他顶点附近的同类旋转。因为把正二十面体转一转,原来的顶点会跑到别的位置;从新视角看,另一个顶点也可以成为“那个顶点”。

所以,正规子群不是随便挑几个动作,而是一个不能偏心的完美打包组合。邀请了一种动作,就可能被对称性连带着邀请一整类动作。这个“连带”很像病毒感染:只要一个同类动作进来了,被对称性绑定的同类动作就会跟着涌进来。

数学上,这种“不管换哪个视角都不变”叫

$$gNg^{-1}=N.$$

但这行公式不用急着背。它的意思就是:把小圈子拿到另一个合法视角下看,回来以后还是它自己。这样的子群,才是根式解可以利用的公开台阶。

$A_5$ 的 60 个动作分成五个团伙

既然正规子群必须公平、不能偏心,我们就要看 $A_5$ 的动作到底分成哪些“同类团伙”。

把 $A_5$ 看成正二十面体的 60 种旋转动作,可以分成五类。

如果换成足球语言,这五类也能看见。足球上的黑五边形对应正二十面体的 12 个顶点;足球上的白六边形对应正二十面体的 20 个面;足球上那些边的中点,对应正二十面体的 30 条边。于是,正二十面体的“顶点、面、边”,在足球上就变成了“五边形、六边形、边”。这就是足球和 $A_5$ 的联系。

第一类:什么都不做。只有 1 种动作。

$$1$$

这是任何子群都必须包含的动作。

第二类:捏住一对相对的边,旋转 180 度。正二十面体有 30 条边,也就是 15 对相对的边,所以这种动作有 15 种。

$$15$$

第三类:捏住一对相对的面来旋转。正二十面体有 20 个面,这类三重旋转对应 20 种动作。

拿足球说,就是捏住一对相对的白色六边形中心来转。每条这样的轴可以转 $120^\circ$ 或 $240^\circ$,所以 10 对相对六边形给出 20 种非平凡旋转。

$$20$$

第四类:捏住一对相对的顶点,旋转 72 度。正二十面体有 12 个顶点,也就是 6 对相对顶点;绕每条这样的轴有不同方向的五重旋转,其中一批有 12 种。

拿足球说,就是捏住一对相对的黑色五边形中心来转。足球绕这条轴转 $72^\circ$,图案会重新对齐。这类“小转”形成一批 12 个动作。

$$12$$

第五类:仍然是捏住相对顶点,但旋转 144 度。它和 72 度旋转同样来自顶点轴,却在 $A_5$ 内形成另一批同类动作,也有 12 种。

同一条五边形轴还可以转 $144^\circ$,相当于一次跨过两个五边形位置。这类“大转”又形成另一批 12 个动作。对小孩来说,可以直接在足球上演示:绕黑五边形中心转一格,是 $72^\circ$;转两格,是 $144^\circ$。它们都让足球图案回到整齐状态,但在群里属于两批不同的同类动作。

$$12$$

所以 $A_5$ 的 60 个动作被绑成五个不可随便拆开的模块:

$$1,\quad 15,\quad 20,\quad 12,\quad 12.$$

如果你想找正规子群,就不能在这些模块里面零买。你不能只拿一个边旋转、只拿一个面旋转、只拿某一个顶点旋转。因为正二十面体太对称了,所有边、所有面、所有顶点的地位都是平等的。只要你拿了一种,就要把同类整包带走。

这就是 $A_5$ 的第一道锁:极端对称性强迫动作按团伙打包。

拿足球给小孩讲,可以这样说:如果你说“我只喜欢这个黑五边形附近的旋转”,那就不公平。因为足球转一转,另一个黑五边形也可以跑到你手里的位置。所有黑五边形地位一样,所有白六边形地位一样,所有边也地位一样。所以,一旦你允许某一种黑五边形旋转,其他同类黑五边形旋转就会像排队进门一样全都跟进来。这就是“不能偏心”的意思。

子群的人数必须整除 60

还有第二道锁,来自一个非常朴素但非常有力的定理:拉格朗日定理。

它说:一个有限群里,任何子群的成员个数,必须能整除整个群的成员个数。

$A_5$ 有 60 个动作。所以,如果它里面有一个子群,这个子群的动作个数必须是 60 的因数。也就是说,只可能是

$$1,2,3,4,5,6,10,12,15,20,30,60$$

这些数之一。

为什么会这样?可以用切蛋糕来想。假设大群有 60 块蛋糕,某个子群有 $h$ 个动作。群里的动作会把这个子群复制成很多份同样大小的“影子部门”。这些影子部门要么完全重合,要么完全不重合,最后会把 60 个动作整齐分完。所以 $h$ 必须整除 60。

这条定理对我们很关键。因为正规子群首先必须是子群,所以它的大小也必须整除 60。换句话说,想在 $A_5$ 里找公开台阶,人数必须切得整齐。

致命拼图:怎么拼都拼不出中间台阶

现在把两条规则合在一起。

第一,正规子群必须公平,不能偏心,所以必须按同类团伙整包选。可选模块是

$$
1,
15,
20,
12,
12.
$$

第二,它又必须是子群,所以总人数必须整除 60。

注意,不动动作那个 1 必须选。现在开始拼图。

只选不动动作:

$$1.$$

这当然可以,但它太小了,只是最后的终点,不是中间台阶。

选“不动”加“边旋转”:

$$1+15=16.$$

16 不能整除 60,失败。

选“不动”加“面旋转”:

$$1+20=21.$$

21 不能整除 60,失败。

选“不动”加“一批顶点旋转”:

$$1+12=13.$$

13 不能整除 60,失败。

把两批顶点旋转都选上:

$$1+12+12=25.$$

25 不能整除 60,失败。

多选一点,比如“不动”加“边旋转”加“面旋转”:

$$1+15+20=36.$$

36 不能整除 60,失败。

“不动”加“边旋转”加“一批顶点旋转”:

$$1+15+12=28.$$

28 不能整除 60,失败。

“不动”加“面旋转”加“一批顶点旋转”:

$$1+20+12=33.$$

33 不能整除 60,失败。

继续试下去,你会发现所有中间拼法都失败。真正能通过检查的只有两种极端情况:

$$1$$

$$1+15+20+12+12=60.$$

一个是只剩不动动作,一个是整个 $A_5$。中间没有任何合格的正规子群。

这就是 $A_5$ 的死结:同类动作必须整包带走,这是“病毒感染式”的对称绑定;子群大小必须整除 60,这是“切蛋糕式”的整数限制。两条规则夹在一起,把所有中间道路都堵死了。

为什么这说明 $A_5$ 不能再分解

现在我们终于可以把术语放回来,而且它不再显得突然。

$A_5$ 没有非平凡正规子群。所谓“非平凡”,就是既不是只含不动动作,也不是整个 $A_5$。群论里把这种没有中间正规子群的群叫作单群。

“单”不是简单容易,而是像原子一样不可再公开拆分。对根式解来说,这非常致命。

因为根式解需要的正是一串正规子群形成的台阶。开平方通常对应把某些可能性一分为二;开立方对应处理三重选择;更高次根也类似。每一次开根号,都要让合法互换名单沿着一个公开台阶变小。

但是 $A_5$ 没有中间公开台阶。你想用开平方,就好像想找到一个大小为 30 的正规子群,把 60 个动作分成两半。找不到。你想用开立方,就好像想找到一个大小为 20 的正规子群,让 60 个动作按三份拆。也找不到。你想用别的根号,也仍然需要合适的正规台阶,可 $A_5$ 不给。

所以 $A_5$ 不是普通的复杂,而是根式解意义下的“死疙瘩”。它像一块浑然一体的合金,你可以在表面画线,但没有一条线是真正能切开的公共裂缝。

为什么五次方程会卡在这里

一般五次方程的根,最初可能有 $S_5$ 的 120 种互换。判别式还能帮忙:它可以区分奇偶置换,把 $S_5$ 缩到 $A_5$。这一步相当于先砍掉一半对称性。

但接下来需要继续拆 $A_5$。如果 $A_5$ 像三次方程里的 $A_3$ 那样有明显台阶,根式公式也许还能继续往下走。问题是,$A_5$ 没有。

这就是一般五次方程没有通用根式解的核心障碍。不是因为人类没把公式写长,也不是因为计算技巧不够,而是因为走到 $A_5$ 后,根号需要的中间台阶不存在。

数学上,这个事实是阿贝尔—鲁菲尼定理背后的关键思想之一:一般五次方程的伽罗瓦群不可解,因此不能用根式给出通用公式。

换成本书一直使用的语言,就是:五个根的互换动作太对称、太紧密,开根号无法继续逐层打破它们的不可区分性。

本章小结

这一章只推进了一个核心问题:$A_5$ 为什么不能再分解。

答案可以分三层说。第一,根式解需要的不只是普通子群,而是正规子群,也就是不偏袒任何根、在所有合法重新命名下都站得住的公开台阶。第二,$A_5$ 的 60 个动作被正二十面体的对称性绑成五个团伙:$1,15,20,12,12$,一旦选某类动作,就必须整包带走。第三,拉格朗日定理要求子群大小必须整除 60,而这些团伙无论怎么拼,除了 1 和 60,都拼不出合格大小。

所以 $A_5$ 是一个没有中间正规子群的单群。它不是没有小圈子,而是没有根式解需要的公开中间台阶。判别式最多把 $S_5$ 缩到 $A_5$,但到了 $A_5$,根号找不到继续下手的位置。

不过,一般五次方程不可解,不代表每个五次方程都不可解。下一章,我们看看特殊五次方程为什么可能另有出路。

第十三章 不是所有五次方程都一样

本章引言

一般五次方程没有通用根式公式,但特殊五次方程可能可以解。关键在于:具体方程可能有额外结构,使它的合法互换群变小。

特殊方程有特殊线索

考虑

$$x^5-1=0.$$

它的根是五次单位根:

$$1,\zeta,\zeta2,\zeta3,\zeta^4.$$

这些根不是随便散落的五个数,而是按乘法形成非常整齐的循环结构。这个额外结构让它和一般五次方程完全不同。

所以,看到“五次方程没有通用根式解”时,一定要听见“通用”和“一般”这两个词。

伽罗瓦群因方程而异

每个具体方程都有自己的合法互换名单。一般方程的名单可能很大,甚至是 $S_5$;特殊方程的名单可能小得多。

这就像不同案件的线索不同。有的案件只有模糊统计信息,嫌疑人之间很难区分;有的案件有特殊标记,很多换位一开始就不可能。

伽罗瓦群正是记录这些合法换位的名单。群小,说明我们已经知道得多;群大,说明根之间仍然难分。

可解与不可解的真正判断

一个具体五次方程能不能用根式解,不看它是不是五次这么简单,而要看它的伽罗瓦群是不是可解。这里的“可解”不是方程有没有根,而是群能不能分层拆开。

如果伽罗瓦群比较温和,可以拆,那么这个五次方程可能有根式解。若伽罗瓦群是 $S_5$ 或含有 $A_5$ 的硬核结构,就没有根式解。

这就是伽罗瓦理论最厉害的地方:不必先把根写出来,也能判断根能不能被根式写出来。

从一般结论走向具体计算

到现在为止,我们讲的是大图景。可读者自然会问:具体方程的伽罗瓦群怎么知道?难道只是凭感觉猜?

当然不是。数学家有一整套方法:先看有没有有理根,再看不可约性,再看判别式是不是平方数,再把多项式模不同素数分解,从分解形状推测根的互换类型。

下一章,我们就把这些步骤写成一次破案。

本章小结

这一章只推进了一个核心问题:一般五次方程没有通用根式公式,但特殊五次方程可能可以解。如果把它放回全书主线,就是在问:系数给了我们什么线索,根之间还剩哪些不可区分性,新的工具又打破了哪一层对称。

下一章,我们拿一个具体方程 $x^5-4x+2$ 做一次侦探式计算,看看怎样判断它的伽罗瓦群。

第十四章 一个具体五次方程的计算例子

本章引言

这一章把抽象理论放到一个具体方程上:$f(x)=x^5-4x+2$。我们不直接求根,而是收集线索,判断它的伽罗瓦群。

第一步:有没有有理根

考虑

$$f(x)=x^5-4x+2.$$

如果它有有理根,根据有理根定理,候选只可能是 $\pm1,\pm2$。代入检查:

$$f(1)=1-4+2=-1,$$

$$f(-1)=-1+4+2=5,$$

$$f(2)=32-8+2=26,$$

$$f(-2)=-32+8+2=-22.$$

都不是零。所以它没有有理根。

第二步:为什么要看不可约

没有有理根还不能立刻说明五次多项式不可约,因为它也可能分解成二次因子乘三次因子。但在很多入门讲解里,我们可以先把不可约性理解为:这个方程的五个根不是由更低次数方程分成几组独立处理。

严格证明不可约可以用模素数方法。比如把它模 3 或模 5 化简,观察是否能分解。如果在某个素数模意义下保持不可约,原多项式在有理数上也不可约。

不可约性很重要,因为它说明伽罗瓦群在五个根上是“连通地行动”的,不是把根分成互不相干的小组。

第三步:判别式给出奇偶线索

判别式是否为平方数,可以告诉我们伽罗瓦群是否完全落在 $A_5$ 里。如果判别式不是有理数平方,那么群里一定有奇置换,也就是说它不完全在 $A_5$ 里。

对 $x^5-4x+2$,计算可知判别式不是平方数。我们不在这里手算庞大的判别式,只看它的意义:群不会只由偶置换组成。

这条线索很像破案里的排除条件。它不能单独确定群,但能缩小范围。

第四步:模素数分解透露置换类型

接下来,把多项式模不同素数分解。分解形状能透露伽罗瓦群里某些置换的循环类型。比如模某个素数后,如果分解成一个二次因子和一个三次因子,就暗示群中存在形如 $(ab)(cde)$ 的置换类型。

这一步背后的定理比本书主线略深,但直觉可以这样理解:模素数以后,根在有限世界里的组合方式,会留下原来互换群的影子。

收集足够多的影子,再结合不可约性和判别式,就能判断候选群。对于这个方程,结论是伽罗瓦群为 $S_5$。

结论:没有根式解

既然 $f(x)=x^5-4x+2$ 的伽罗瓦群是 $S_5$,而 $S_5$ 含有不可拆的 $A_5$ 核心,所以这个具体方程没有根式解。

注意,我们没有写出五个根,也没有求出它们的精确值。我们判断的是“能不能用根式写出来”。这正是伽罗瓦理论的力量:根还没被算出,方程的可解性已经被看穿。

这种计算手工做会很累,软件可以帮忙。

本章小结

这一章只推进了一个核心问题:这一章把抽象理论放到一个具体方程上:$f(x)=x^5-4x+2$。如果把它放回全书主线,就是在问:系数给了我们什么线索,根之间还剩哪些不可区分性,新的工具又打破了哪一层对称。

手工计算能让我们看见思路,但真正的大规模计算常交给软件。下一章,我们看看数学软件如何计算伽罗瓦群。

第十五章 数学软件是怎么计算伽罗瓦群的

本章引言

软件不是先把根式公式算出来,再判断方程能不能解。它常常反过来:先分析结构,再判断根式解是否可能。

软件不是魔法

当我们在 SageMath、PARI/GP 或 Magma 里输入一个多项式,让它计算伽罗瓦群时,软件不是在“猜”。它执行的是一套严密的算法流程。

这套流程通常包括:判断不可约性,计算判别式,模不同素数分解,收集置换类型,再用预解式排除候选群。

这和我们上一章手工破案的思路一致,只是软件做得更快、更系统。

先看不可约性

软件会先判断多项式能不能在有理数范围内分解。如果能分解,方程就可能被拆成低次数部分处理;如果不可约,说明所有根在某种意义上属于同一个整体。

不可约性对应伽罗瓦群的传递性。这个词可以简单理解为:群的动作能把任意一个根带到另一个根的位置,根之间没有被分成固定小组。

这一步是确定大方向。

再看模素数分解

接下来,软件会选择一些素数 $p$,把多项式的系数都按模 $p$ 计算,然后观察它怎样分解。

比如分解成一次、四次,或者二次、三次,或者保持五次不可约。每一种分解形状都对应伽罗瓦群里某种循环类型。

这些信息像一张张侧面照片。单张照片可能不够,但多张放在一起,群的轮廓就越来越清楚。

判别式和预解式缩小候选

判别式判断群是否落在 $A_n$ 里。预解式则更像专门设计的探针,用来区分几个可能的候选群。

软件计算伽罗瓦群,不是从根式公式出发,而是从群的可能性出发。它问:哪些群符合目前收集到的所有证据?哪些群被排除?最后剩下的,就是答案。

这正体现了本书反复强调的思想:不求出根,也能判断根能不能被某种工具求出。

本章小结

这一章只推进了一个核心问题:软件不是先把根式公式算出来,再判断方程能不能解。如果把它放回全书主线,就是在问:系数给了我们什么线索,根之间还剩哪些不可区分性,新的工具又打破了哪一层对称。

方程部分的主线到这里已经完整。接下来,我们把“工具限制”这个思想带到几何:尺规作图。

第十六章 尺规作图也是一种“工具限制”

本章引言

尺规作图看起来远离方程,其实和根式解很像:它也在问,给定工具能到达哪些对象。

直尺和圆规允许什么

古典尺规作图只允许两种工具:没有刻度的直尺和圆规。直尺只能过两点画直线,圆规只能以给定点为圆心、给定长度为半径画圆。

这听起来像几何规则,但背后有代数含义。每一步新点通常来自直线与直线、直线与圆、圆与圆的交点。

直线与直线只需要一次方程;直线与圆、圆与圆最多带来二次方程。于是,每一步最多引入平方根。

尺规作图与平方根

如果从已知长度 1 出发,尺规作图能构造的长度,基本上来自不断做四则运算和开平方。也就是说,它对应的是一串二次扩张。

这和二次方程的根式解非常像。二次方程可以靠平方根解决;尺规作图也只能不断靠平方根扩展可构造的数。

所以,尺规作图不是“手巧不巧”的问题,而是“允许的代数操作是什么”的问题。

不是所有数都能构造

如果一个长度需要开立方才能得到,而且不能被转化成一串平方根,那么尺规作图就造不出来。这里的不可能不是画得不够精细,而是工具能力不匹配。

这和五次方程没有根式解很相似。五次方程不是数学家不会写,而是根式工具不够;某些几何作图不是工匠不够巧,而是尺规工具不够。

工具限制,是现代数学里非常重要的主题。

从方程到几何的同一精神

方程里,我们问:四则运算和开根号能不能表达根?几何里,我们问:直尺和圆规能不能构造某个点或长度?

问题表面不同,精神相同:先明确工具,再判断目标结构是否可达。

这就是为什么伽罗瓦思想可以照亮尺规作图。它不只是方程技巧,而是一种判断可能性的方式。

本章小结

这一章只推进了一个核心问题:尺规作图看起来远离方程,其实和根式解很像:它也在问,给定工具能到达哪些对象。如果把它放回全书主线,就是在问:系数给了我们什么线索,根之间还剩哪些不可区分性,新的工具又打破了哪一层对称。

尺规作图的限制最有名地体现在任意角三等分上。下一章,我们看这个几何问题怎样变成代数问题。

第十七章 为什么不能三等分任意角

本章引言

三等分角是古希腊三大作图难题之一。它看起来像几何问题,最后却变成了代数工具限制的问题。

特殊角可以,不等于任意角可以

有些角当然可以三等分。比如 $90^\circ$ 可以三等分成 $30^\circ$。所以“不能三等分任意角”不是说任何角都不能三等分,而是说不存在一套尺规方法,能处理所有角。

数学里的“任意”很强。只要有一个角无法尺规三等分,任意角三等分就失败了。

这和五次方程一样:特殊五次方程可以解,不代表一般五次方程有通用公式。

三角恒等式把几何变成代数

三等分角可以通过三角恒等式转化。设 $\theta=3\phi$,那么

$$\cos 3\phi=4\cos^3\phi-3\cos\phi.$$

如果已知 $\cos\theta$,要找 $\cos\phi$,就需要解一个三次方程。

某些三次方程的解不能只靠不断开平方得到,于是对应的角就不能尺规三等分。

工具能力与目标结构不匹配

尺规作图只能不断开平方,而某些三等分角问题需要真正的三次结构。这就像你只带了螺丝刀,却遇到需要焊接的任务。

不是努力不够,而是工具类型不匹配。

五次方程的无根式解也是这种精神:根式工具有边界,某些结构超出了它能处理的范围。

几何不可能背后的代数判断

“不能作图”听起来像经验判断,但数学证明给的是结构判断。它把作图步骤翻译成代数操作,再证明目标数不在这些操作能到达的范围里。

这一步非常现代:不必尝试所有画法,只要理解工具产生的结构,就能证明不可能。

这和伽罗瓦理论在方程中的作用完全呼应。

本章小结

这一章只推进了一个核心问题:三等分角是古希腊三大作图难题之一。如果把它放回全书主线,就是在问:系数给了我们什么线索,根之间还剩哪些不可区分性,新的工具又打破了哪一层对称。

下一章,我们把视野再放远一点,回答一个自然的问题:偏微分方程里是不是也有伽罗瓦理论?

第十八章 偏微分方程里也有伽罗瓦理论吗

本章引言

上一章讲三等分角时,我们看见了一件很重要的事:有些问题不是努力画、努力算就能解决的,关键要看工具和目标结构是否匹配。尺规作图只能不断开平方,所以某些需要三次结构的角就不能被尺规三等分。

现在我们把视野再放远一点。有人可能会问:既然伽罗瓦理论能判断代数方程能不能用根式解,那么偏微分方程里是不是也有类似的伽罗瓦理论?这个问题问得很好,但答案要小心说。

如果你问的是:“偏微分方程是不是也像五次方程那样,有几个根可以互换,然后组成一个有限的伽罗瓦群?”那通常不是。偏微分方程求的不是有限个数,而是函数,世界大得多,不能直接照搬。

但如果你问的是:“偏微分方程里有没有类似精神:不一定先写出解,也能判断解是否存在、是否唯一、是否稳定、是否光滑?”那答案是有。而且这正是现代数学里非常重要的一种眼光。

代数方程找的是数,偏微分方程找的是函数

先把对象分清楚。

代数方程,比如

$$x^5-4x+2=0,$$

要找的是数。它有五个复数根。我们可以把这些根记作 $x_1,x_2,x_3,x_4,x_5$,再研究它们之间允许怎样互换。虽然根可能很难写出来,但至少它们是有限个对象。

偏微分方程不一样。它通常要找的是函数。比如热方程大致长这样:

$$\frac{\partial u}{\partial t}=k\frac{\partial^2u}{\partial x^2}.$$

这里未知的不是一个数,而是一个函数 $u(x,t)$。它表示位置 $x$ 和时间 $t$ 处的温度。你要找的不是五个根,而是一整张随时间变化的温度图。

再比如波动方程:

$$\frac{\partial^2u}{\partial t^2}=c^2\frac{\partial^2u}{\partial x^2}.$$

它描述的是波怎样传播。未知量仍然是函数。

所以,代数方程像是在找几个隐藏的数字;偏微分方程像是在找一整幅会变化的画。对象不同,工具当然不能简单照搬。

为什么不能直接说“PDE 的伽罗瓦群”

伽罗瓦理论最初处理的是代数方程。它研究的是:在系数给定的情况下,方程的根有哪些合法互换?这些互换动作组成的群,能不能被根号一层层拆开?

这里有几个关键词:根,互换,有限个对象,根式解。

偏微分方程里,这几个关键词都变了。它的解不是有限个根,而是函数;函数之间不是简单换座位;我们关心的也不一定是“能不能用根号写出来”,而常常是“解是否存在”“是否唯一”“是否会爆炸”“是否足够光滑”。

所以,如果把代数方程的伽罗瓦群原封不动搬到偏微分方程里,就会误导读者。就像尺规作图不能直接等同于五次方程,偏微分方程也不能直接等同于代数方程。

不过,数学里确实有更高等的理论,叫微分伽罗瓦理论。它研究某些微分方程的解之间的代数关系和对称性。这个理论通常先从常微分方程讲起,比本书现在的主线深得多。偏微分方程也有相关的推广思想,但那已经不是高中版应该展开的内容。

所以,本章的回答要分两层:严格地说,偏微分方程不能简单照搬我们前面讲的有限根互换版伽罗瓦理论;但从思想上说,它确实延续了伽罗瓦理论最迷人的部分:不先写出答案,也能判断答案的结构。

PDE 里最常问的不是“公式是什么”

我们学二次方程时,最自然的问题是:根是多少?公式是什么?

但在偏微分方程里,数学家经常先问别的问题。

第一个问题是:解存在吗?

这听起来很基础,但一点也不简单。给定一个方程,再给定初始条件和边界条件,真的有函数满足所有要求吗?有时有,有时没有。就像问一座桥能不能搭起来,第一步不是画装饰,而是判断这座桥是否可能存在。

第二个问题是:解唯一吗?

如果同一个问题有很多个解,那就麻烦了。物理上同样的初始状态,不能随便演化出完全不同的结果。唯一性告诉我们,问题给出的条件是否足够确定。

第三个问题是:解稳定吗?

现实中的测量总会有误差。如果初始数据只差一点点,解却差得天翻地覆,那么这个方程就很难用来做可靠预测。稳定性问的是:小误差会不会被放大成大灾难。

第四个问题是:解光滑吗?

有些解虽然存在,但可能很粗糙,甚至出现尖点、断裂、奇异行为。光滑性问的是:这个解够不够好,能不能继续求导,能不能符合我们对物理或几何的期待。

注意,这些问题都不要求我们一开始写出完整公式。我们可能还不知道解具体长什么样,却已经能判断它是否存在、是否唯一、是否稳定、是否光滑。

这和伽罗瓦理论的精神非常接近。伽罗瓦理论也不先把五个根写出来,而是先判断:这些根能不能被根式写出来?

一个高中生可以抓住的例子:热会不会自己变得更热

为了让这种思想更具体,我们看热方程的直觉。

假设一根细金属棒,两端保持不超过 $100^\circ$ 的温度,开始时整根棒的温度也不超过 $100^\circ$。直觉上,棒子内部不应该凭空冒出一个 $200^\circ$ 的热峰。热量会扩散,不会无中生有地在内部制造更高的最高温。

数学里有一个思想叫最大值原理。它大致说,在某些类型的方程里,最大值会受边界和初始条件控制。你不必先把温度函数 $u(x,t)$ 完整写出来,也能判断它不会超过某个范围。

这就是偏微分方程里的结构判断。

它不像伽罗瓦群那样研究根的互换,但它同样体现了一个成熟的数学态度:先问结构允许什么,再问具体解是什么。

再看波:一点变化会怎样传播

波动方程也适合高中生想象。你拨动一根弦,波会向两边传播。你轻轻拨一下,弦不会立刻在远处产生巨大震动。影响有传播速度,有范围,有能量约束。

数学家会用能量估计来描述这种现象。所谓能量估计,可以先理解成:虽然我们未必马上知道每一时刻弦的精确形状,但可以控制某种总量不会乱跑。

这也不是求具体公式,而是判断行为边界。

从这个角度看,PDE 的工具箱和伽罗瓦理论有一个共同点:它们都把“会不会”“能不能”“是否稳定”放到“怎么算”之前。

这和第十七章的尺规作图有什么关系

第十七章讲三等分角时,我们说:尺规作图的限制来自工具。直尺和圆规每一步最多带来平方根,所以某些需要三次结构的角不能被作出。

偏微分方程的情况更宽,但精神相似。我们先弄清楚工具和结构,再判断能做到什么。

在代数方程里,工具是四则运算和开根号。

在尺规作图里,工具是直尺和圆规。

在偏微分方程里,工具可能是最大值原理、能量估计、傅里叶分析、变分法、弱解思想。高中生不需要掌握这些工具的技术细节,只要知道它们的共同作用:帮助我们在没有显式公式时,仍然判断解的性质。

这就是为什么本书最后要提 PDE。不是为了把话题拉远,而是为了让读者看见:五次方程的故事不是孤立的。数学真正强大的地方,常常不是“我能把答案写得多漂亮”,而是“我知道某条路能不能走”。

所以,PDE 里到底有没有伽罗瓦理论

现在可以回答本章标题。

如果按本书前面讲的狭义意思,伽罗瓦理论研究的是代数方程的根如何互换,以及这种互换群能否被根号拆开。这个版本不能直接搬到偏微分方程里。

如果按更广的数学精神,答案又是肯定的:偏微分方程里同样有大量关于对称、结构、变换、可解性和不可解性的思想。某些高等理论也确实把伽罗瓦式的想法推广到微分方程中,只是那需要更多大学数学准备。

对高中读者来说,最合适的结论是:PDE 里不该简单说“也有同一个伽罗瓦群”,但可以说,它延续了伽罗瓦理论带给我们的思维方式。

这种思维方式就是:

先不要急着追公式。先问对象是什么,工具是什么,结构允许什么。

本章小结

这一章把原来三个偏微分方程章节合并成一个问题:偏微分方程里是不是也有伽罗瓦理论?答案要分清层次。

严格地说,偏微分方程不能直接照搬代数方程里的有限根互换群。代数方程求的是有限个数,偏微分方程求的是函数,问题对象已经变了。但从思想上说,PDE 和伽罗瓦理论有共同精神:不一定先写出具体解,也能判断解是否存在、是否唯一、是否稳定、是否光滑。

这就把全书最后的视野收束回来:数学不只是求答案,更是判断可能性、结构和限制。下一节,我们进入结语。

结语 数学不只是求答案

回头看,全书真正讲的并不是一个孤零零的结论:“一般五次方程没有通用根式解。”这个结论当然重要,但更重要的是我们怎样走到它。

我们从二次方程开始,重新理解那个熟悉的平方根。它不是公式里的装饰,而是在把两个根分开。接着,韦达定理告诉我们,系数看到的是根的整体信息,不是每个根的身份。于是,根的位置互换就变得必要:它是在测试当前线索还能不能区分根。

两个根的互换只有两个动作,三个根有六个动作,四个根有二十四个动作,五个根有一百二十个动作。动作越来越多,但真正的关键不是数量,而是这些动作能不能被根号一层层拆开。二次、三次、四次方程可以拆,所以有根式公式;一般五次方程会卡在 $A_5$ 这样的结构上,所以没有通用根式公式。

这不是数学的失败。恰恰相反,这是数学成熟的表现。它告诉我们,有些问题不必等到答案被写出来,结构本身已经告诉我们哪些工具可行,哪些工具注定不够。

尺规作图和偏微分方程的类比也在提醒我们同一件事:数学不只是求答案。更深的能力,是判断可能性、结构和限制。知道什么能做,也知道什么不能做,这本身就是一种理解。

如果读完这本书,你以后再看到一个公式,不只问“怎么代入”,还会问“它打破了哪一层对称”;看到一个问题,不只问“答案是多少”,还会问“给定工具能不能到达答案”,那么这趟从韦达到五次方程的路,就没有白走。

后记 我为什么写这本书

我写这本书,其实是从一个很久以前的课堂疑问开始的。

高中结束以后,我进入大一。那时的数学课里有一门离散数学,老师讲到群论。现在回想起来,群论这个词第一次进入我的视野时,并没有立刻显得亲切。它不像微积分那样能马上画出曲线,也不像线性代数那样很快能看到矩阵运算。它一上来讲集合、运算、单位元、逆元、封闭性,看起来像是在给一些很抽象的规则取名字。

老师当时反复强调:这个东西很有用。可是“有用”两个字,如果没有被真正讲透,对刚进入大学的学生来说,常常只是一句悬在空中的提醒。老师也提到过一个应用:一元五次方程没有根式解,背后和群论有关。我记得这个说法给我留下了印象,但当时它更像一个被点到为止的事实。为什么方程有没有公式,会和一群“动作”有关?为什么根要互换?为什么互换以后就能判断公式是否存在?这些问题并没有在那一刻完全打开。

后来我才慢慢知道,群论不是数学家为了抽象而抽象出来的游戏。它其实是在研究对称性。只要一个问题里有“变了以后仍然保持某种东西不变”,群论就可能出现。方程的根可以互换,几何图形可以旋转,晶体有空间对称,物理定律在坐标变换下保持形式不变,这些看起来很不同的现象,背后都可以用群的语言来组织。

也正因为如此,群论在数学和物理里越走越深。它不只是解释五次方程为什么没有通用根式解,也进入了几何、拓扑、数论、表示论,进入了现代物理对对称性的理解。到了广义相对论,人们已经深刻意识到,物理定律不应依赖某个特殊坐标系。外尔进一步试图把这种思想推广,提出规范思想的早期形式。再往后,杨—米尔斯理论把非交换群的对称性放到物理基本相互作用的核心位置。今天我们回头看,会发现“群”不再只是离散数学课本里的一个定义,而像是一种理解世界结构的语言。

可是这种语言如果一开始只以定义出现,确实很难让人感到它为什么重要。我写这本书,就是想把当年那个没有完全说透的地方,重新慢慢说一遍。不要先告诉读者“群论很有用”,而是从一个高中生熟悉的问题出发:二次方程为什么有公式?韦达定理为什么只看见根的整体?根的位置为什么要互换?互换动作为什么会组成群?最后才走到五次方程为什么没有通用根式解。

我希望这本书能让读者有一种感觉:抽象概念不是从天上掉下来的,它是被问题一步步逼出来的。群论也不是冷冰冰的符号,而是当我们试图理解“什么变了,什么没变”时,自然长出来的语言。

如果你正好也是在高中之后、大学之初,或者在某个数学概念面前感到“老师说它很有用,但我还不知道它为什么有用”,那我希望这本书能陪你把这段路走慢一点。很多重要的数学思想,第一次遇见时并不会立刻发光。它们需要一个具体问题,需要一条清楚的主线,也需要一点时间。等那条线终于连起来,抽象的词会突然有了重量。

这本书想做的,就是帮“群论很有用”这句话,找到一个可以真正落地的故事。