如果说,杨米尔斯理论和广义相对论这两本书,是我读博士期间自学的内容,那么移动通信原因是我的老本家,这是我学了四年的专业课,把它做个系统梳理,到底什么是移动通信原理的核心。全书共十四章。

《重新理解移动通信:从香农到5G》

序言:我为什么重新学习移动通信

1. 教室里的黑板与逐渐远去的记忆

在这个移动互联网全面接管人类生活的时代,很少有人会去刻意留意手机屏幕右上角的那个小小的信号图标。无论是代表着极速体验的“5G”,还是曾经作为革命性标志的“4G”,对于绝大多数人来说,它们仅仅意味着短视频加载的速度、微信抢红包的快慢,或者是玩游戏时 Ping 值的跳动。

但我知道,事情远没有那么简单。因为在很多年前的大学时代,我曾经试图推开过这扇大门。

那时候,我读的是通信工程专业。对于每一个通信学子而言,《现代通信原理》是一门绕不过去的专业必修课。这门课在工科的鄙视链里占据着相当高耸的位置,不仅因为它是一切现代通信系统的基石,更因为它那令人生畏的数学门槛。

回想起来,那是一段被公式和定理支配的日子。黑板上永远写满了复杂的数学推导:傅里叶变换的频域与时域转换,贝塞尔函数的无穷级数,高斯白噪声的概率密度公式。在这门课里,我第一次认识了那些在通信史上熠熠生辉的名字,也第一次系统地接触到了那些后来改变了世界的专业名词:

调制(Modulation)与解调(Demodulation)、信道编码(Channel Coding)、扩频通信(Spread Spectrum)、CDMA(码分多址)、Walsh 码的正交、RAKE 接收、功率控制(Power Control)……

为了应付考试,我们曾日夜背诵着香农定理(Shannon's Theorem),在草稿纸上一遍遍地画着 QPSK 的星座图,努力去理解多径衰落(Multipath Fading)究竟是如何把原本完美无瑕的信号撕扯得面目全非的。

公式是通信工程的共同语言。 比如奈奎斯特第一准则,比如香农公式:

$$ C = B \log_2(1 + \frac{S}{N}) $$

那时候,看到这个公式,我只知道 C 是信道容量,B 是带宽,S/N 是信噪比。只要把参数代进去,就能算出期末考试试卷上的正确答案。当时我甚至隐隐有一种错觉:只要把这些公式背熟,只要能解出微分方程,自己就已经摸到了移动通信的真正门槛。毕竟,书本上的知识看起来是那么完备、严谨、自洽,仿佛前辈的大师们已经用一套完美的数学工具,把整个物理世界暴躁的电磁波彻底驯服了。

然而,理论与现实之间,往往隔着一道常人难以跨越的鸿沟。毕业之后,命运的轨迹发生了不可预知的偏移。

我离开了通信行业。我先是转向了自动化领域,后来又进入了计算机行业敲代码,最后几经辗转,跨入了一个看似与技术毫无瓜葛的领域——金融行业。

在金融的丛林里,人们讨论的是市盈率、宏观调控、资本市场的起伏和资产配置。曾经烂熟于心的通信原理,那些曾经让我抓耳挠腮的傅里叶变换和 Walsh 码,变成了一个遥远的专业背景。它们像被刻在硬盘坏道里的旧数据,又像简历里一行逐渐变淡的墨迹,再也无人问津。

2. 平行世界里的疯狂大爆炸

时间在这条平行的轨道上飞速流逝。这十年里,我所在的金融与计算机领域发生着天翻地覆的变化,但在另一个平行世界——移动通信世界——却没有因为我的离开而停下脚步。

相反,它正经历着人类科技史上最疯狂、最波澜壮阔的一场技术大爆炸。

在我远离通信的这十年间,4G(LTE,长期演进)在全球范围内完成了大规模的商用部署。智能手机早已不再是一个简单的通话工具,它变成了人类进化出的新器官。短视频平台的爆发、移动支付对现金的彻底颠覆、网约车在城市里的日夜穿梭、随时随地的移动办公与云端同步……几乎所有的互联网奇迹,无论是那些市值万亿的科技巨头,还是深刻改变普通人生活的应用,全部都建立在一张无形但无处不在的移动宽带网络之上。

而在 4G 的红利还未完全释放殆尽之时,产业界和学术界又马不停蹄地拉开了 5G(第五代移动通信)的宏大叙事。

当我在飞机场、高铁站或者高档写字楼里打开新闻客户端,屏幕上充斥着各种极具未来感、甚至略带科幻色彩的词汇:毫米波(Millimeter Wave)、大规模天线阵列(Massive MIMO)、网络切片(Network Slicing)、低时延高可靠(uRLLC)、海量机器连接(mMTC)、万物互联……

我突然发现了一件令我感到极度不安的事情:作为一个正牌通信工程专业毕业的人,我竟然已经看不懂移动通信的新闻了。

这种感觉极其微妙,甚至带着一丝黑色幽默。它最尴尬的地方不在于完全陌生,而在于“似曾相识”。那些词语我好像都见过,但我已经不知道它们在今天的巨型系统里处于什么位置:

  • 调制: 我懂,不就是把低频信号骑到高频载波上吗?但我不明白为什么现在的新闻里动不动就是 256QAM 甚至 1024QAM,在那么嘈杂的信道里,系统是怎么把极其细微的相位和幅度差别分辨出来的?
  • 编码: 我学过卷积码和维特比译码,但新闻里全是在谈 5G 标准里的 LDPC 码和 Polar 码之争,它们到底突破了什么数学极限?
  • 多址: 我清楚地记得 CDMA(码分多址)是 3G 时代的绝对霸主,通过互相正交的伪随机码把用户区分开,堪称数学之美的典范。但我完全搞不懂为什么 4G 会如此决绝地抛弃了它,全面转向了 OFDMA(正交频分多址),而 5G 甚至一度热烈讨论过 NOMA(非正交多址),这不是自己打自己脸吗?
  • 天线: 以前记忆里的基站,铁塔上孤零零地挂着几根天线,现在的 5G 基站怎么变成了 64 根甚至 128 根的恐怖矩阵?波束赋形(Beamforming)到底是怎么把电磁波像探照灯一样打到每一个移动的人身上的?

那些熟悉的积木,已经被重新搭成了一座极其宏伟、但也极其复杂的新大楼。而我,站在楼下,手里拿着十年前旧大楼的旧图纸,彻底迷路了。这种失落感,不仅是对一门知识的遗忘,更像是一个曾经身在局中的人,突然发现自己被时代无情地甩出了一张加速旋转的离心机。

3. 三万英尺高空上的重构

转机出现在一次寻常的出差途中。

后来有一次,我去广州清算所调研。来回飞机的旅途漫长且无聊,为了打发时间,我在机场书店闲逛。命运使然,我随手翻开了一本关于移动通信的书——《通信之道:从微积分到 5G》。

或许是多年未见的技术名词重新唤醒了底层的记忆,又或许是对未知大楼的好奇心战胜了疲倦。飞机起飞,在几万英尺的云层之上平稳飞行。为了飞行安全,手机必须强制关闭蜂窝信号。

这简直是一个巨大的隐喻:在一个完全没有移动通信信号的密闭机舱里,我,一个转行十年的金融从业者,却开始如饥似渴地重新学习无线通信。那一刻,我觉得无比荒谬,又无比真实。

在翻阅书页的过程中,我渐渐意识到,自己真正想补上的,绝对不仅仅是 4G 到 5G 的几条零碎的百科知识点。那些“更快、更密、更高频”的结论,只是水面上的冰山。我真正渴望探寻的,是这座冰山下方那庞大的根基——移动通信这条技术长河的来龙去脉。

从 1G 的模拟蜂窝,到 2G 的数字语音;从 3G 试图拥抱数据但步履维艰,到 4G 的全 IP 化彻底引爆移动互联网;再到 5G 试图将人、车、城市和工厂全部连接在一起的系统重构。表面上看,是网速的跃升。但更深处的故事,是人类的工程师和科学家们,如何在有限的频谱资源、极其嘈杂的无线信道、高速移动的终端和错综复杂的城市物理环境中,一次次利用数学公式和物理定律作为武器,一点一点地逼近那个似乎永远无法触碰的信息传输极限。

这是一部充满妥协、工程智慧、数学美感与惨烈商业博弈的史诗。在这个过程中,有些曾经完美无瑕的理论在现实的多径衰落面前败下阵来,有些一开始并不起眼的算法最终登上了王座。

4. 谁需要读这本书?

随着阅读的深入,我脑海中原本散落的、孤立的知识点开始发生奇妙的化学反应,它们开始重新连接。我逐渐明白,为什么当年的教材让人觉得如此晦涩,为什么今天的新闻让人觉得云里雾里,为什么很多人一看到通信原理的公式就望而却步。

因为我们看移动通信的角度,缺少了一张具有全景视角的“地图”。

传统的通信教材往往是从上百页的数学推导开始,当你还没有弄明白这些公式到底在解决现实世界中的哪一个痛点时,你已经被无穷无尽的微积分淹没了。而科普文章又往往流于表面,只告诉你“5G 就像把单车道变成了八车道”,却刻意回避了那些真正展现人类智慧底色的核心公式,让读者知其然而不知其所以然。

于是,我萌生了一个想法。我要写一本书。

这不是一本用来应付期末考试的纯理论教材,更不是一堆干瘪的技术参数罗列。这是一本写给**“学过一点通信、或者对底层硬核技术有好奇心,但后来又被技术浪潮甩开的人”**看的移动通信原理史。

在这本书里,我们不会回避公式。正如前面所说,文章中要有必要的公式,这些公式帮助读者理解书的内容,公式不可缺少。但我向你保证,书里出现的每一个公式,都不会是冷冰冰的符号堆砌。它们将会是我们理解这栋大楼直觉层的升华工具。当我们在文字和直觉比喻中走到逻辑的尽头时,公式就像一把极其锐利的手术刀,切开复杂的表象,露出最本质的物理规律。我会带着你,像破案一样,去解析这些公式背后的故事与动机。

如果你曾经在通信原理的课堂上感到迷茫;如果你是一个软件工程师,每天都在调用网络 API 却不知道数据在空气中经历了怎样的生死搏杀;或者你只是单纯地想弄明白,为什么你的手机在拥挤的地铁里依然能流畅地播放高清视频……那么,这本书就是为你准备的。

让我们重新出发,找回那失去的十年,重新理解移动通信。


第一章:重新打开那本通信原理书——从一条链路到一张网络的三层地图

1. 我们为什么会迷失在名词的迷宫里?

任何一门现代工业学科,经过几十年的发展,都会在内部滋生出一套壁垒森严的话语体系。移动通信也不例外。

如果你试图去网上搜索一篇科普文章,想要搞清楚 5G 到底比 4G 强在哪里,你大概率会迷失在一座由字母缩写组成的迷宫里。作者会告诉你,5G 的核心优势在于它使用了 eMBB、uRLLC 和 mMTC 三大场景;为了实现这些场景,它在物理层采用了更加灵活的 OFDM Numerology,用 LDPC 码替换了 Turbo 码,控制信道使用了 Polar 码;基站端引入了 Massive MIMO,结合波束赋形(Beamforming)技术提升了频谱效率;而在核心网侧,它通过 SBA 架构实现了网络切片(Network Slicing)……

如果你没有受过专业的通信工程训练,看完这段话,你的大脑中大概只有一片嗡嗡作响的白噪声。

就算你和我一样,大学里曾经啃过《现代通信原理》,当年在考场上能熟练地推导香农极限公式,能够默写出奈奎斯特第一准则,面对如今的这些词汇,依然会感到一种强烈的**“知识坐标失焦感”**。

这种失焦感来源于哪里?

它来源于我们看移动通信的角度,缺少了一张具有全景视角的**“地图”**。

无论是当年的大学教材,还是现在的技术新闻,最大的问题在于它们往往喜欢把所有的技术名词“摊平”了摆在你的面前。Turbo 码、QAM 调制、CDMA、OFDMA、MIMO、软切换、频率复用、网络切片……这些词看上去挤在同一个庞大的“移动通信世界”里,似乎它们都在做同一件事——让手机上网更快。

但如果你仔细审视,它们其实并不在同一个物理层面上。

如果你把它们混为一谈,就会像把汽车的“火花塞工作原理”和城市的“红绿灯调度算法”放在一起比较一样荒谬。火花塞和红绿灯都在为城市交通服务,但它们解决的根本不是同一个维度的问题。

这就引出了这本书想要交付给你的最核心的工具:“三层框架地图”

在这本书后续的几万字里,我们会遇到无数看似晦涩的缩写和极其硬核的公式。但只要你在阅读时带上这张地图,你就永远不会迷失方向。在遇到任何一个新的概念时,你只需要问自己一个问题:这个技术,到底是在哪一层起作用的?

我们将整个庞大、复杂、精密的移动通信系统,极其克制地拆解为从底层到高层的三个维度。


2. 第一层:无线链路原理(点对点的魔法)

这是整个移动通信系统的最底层,也是所有通信原理教材花费笔墨最多的地方。

这一层关心的核心问题极其纯粹:“一条无线信号,如何在空气中被可靠地传输?”

为了理解这一层,你需要先清空大脑。假设这个世界上所有的繁华都已经褪去,世界上只剩下唯一的一个发送者(比如一个孤零零的基站)和唯一的一个接收者(比如你手里拿着的唯一一部手机)。周围没有任何其他人在打电话,也没有任何其他基站。

即使在这样极端简单的“点对点”场景下,通信依然极其困难。为什么?因为空气是一个极其恶劣的信道。

当你发出一句“你好”,这束电磁波在飞向你的手机时,会遭遇无数的劫难:它会随着距离的增加而急剧衰减(自由空间损耗);它会被路过的汽车发动机产生的电磁火花干扰(白噪声);它会撞在大楼上、大树上、地面上,分裂成成百上千条微弱的路径,这些不同路径的信号一前一后到达你的手机,互相叠加、抵消,把原本完美的波形撕扯得面目全非(多径衰落)。

在第一层,工程师们的任务,就是要把原本极其脆弱的信息比特,武装到牙齿,让它们能在这个恶劣的环境里活下来,并被接收端准确无误地还原。

在这个维度里,你会遇到以下这些“重武器”:

  • 调制与解调(Modulation): 信息不能直接裸奔,它必须“骑”在一种高频的电磁波载波上。QPSK、16QAM、256QAM,本质上研究的都是“如何用更巧妙的幅度或相位变化,把更多的数据塞进一个电磁波符号里”。
  • 信道编码(Channel Coding): 既然出错不可避免,那我们就主动增加“冗余”。在原始数据里巧妙地安插校验位,这样哪怕路上丢失了一部分,接收端也能像解开数独游戏一样,把错误猜出来并纠正。卷积码、Turbo 码、LDPC 码,全都在干这件事。
  • 均衡与同步(Equalization & Synchronization): 面对多径衰落造成的信号拖尾和混叠,接收端必须有一套极其复杂的算法来估算信道的破坏程度,然后反向进行补偿,把扭曲的信号重新拉直。

在第一层,我们要应对的是大自然本身的物理规律,是热力学定律带来的噪声,是电磁波传播的基本物理法则。这里也是公式最密集的地方,比如那个决定了全人类通信速度天花板的香农公式:

$$ C = B \log_2(1 + \frac{S}{N}) $$

不要怕这个公式,在接下来的章节里,我会向你证明,它是极其符合人类直觉的。


3. 第二层:多用户空口原理(路口的博弈)

第一层解决了“一条信号”的问题。但是,真实的世界里,一个基站周围怎么可能只有一个人?

在最繁华的 CBD 商业区,或者在一个容纳了八万人的体育场里,可能有成百上千部手机同时在试图和头顶上的那个基站进行通信。空气只有一份,电磁波在同一个空间里会互相叠加、互相淹没。

所以,第二层关心的核心问题是:“一个基站,如何同时服务成百上千个用户?”

这是一个典型的资源分配和博弈问题。在第一层里,电磁波在与大自然作斗争;而在第二层里,电磁波在与其他人类用户的电磁波作斗争。有限的无线电波资源,到底该怎么切分,才能让大家都不觉得卡顿?

在这个维度里,你会遇到以下这些名词:

  • 多址技术(Multiple Access): 这是划分空气资源的哲学。把频率切成一条条车道分给不同人,叫 FDMA(频分多址);让大家排队按时间顺序说话,叫 TDMA(时分多址);大家在同一个频率、同一个时间同时说话,但每个人使用不同的数学暗号,这叫 CDMA(码分多址);把带宽切成成百上千个极窄且互相不干扰的正交子载波,这叫 OFDMA(正交频分多址)。
  • 调度(Scheduling): 谁的信道好,谁的数据急,基站每隔 1 毫秒(甚至更短)就要做出决定,把哪一块频率资源分配给哪一个用户。调度算法是 4G 和 5G 基站真正的“大脑”。
  • MIMO(多输入多输出): 空气不够用怎么办?既然时间和频率都被瓜分干净了,工程师们硬生生地开辟了第三个维度——空间维度。利用多根天线,在同一时刻同一频率,在空间的不同方向上独立发送不同的数据流,这是现代通信史上最伟大的魔术。

4. 第三层:蜂窝网络原理(城市的脉络)

第二层解决了一个基站的容量问题。但真实的世界里,人们不是永远站在一棵树下打电话。

人是在城市里穿梭的,是在时速 350 公里的高铁上飞奔的。一个基站的覆盖范围最多只有几公里,甚至在 5G 时代只有几百米。要覆盖整个中国,你需要成百上千万个基站。

因此,第三层关心的核心问题是:“成千上万个基站,如何组成一张全国性、甚至全球性的移动网络?”

当这套系统从一个点扩大到一个面时,工程的复杂度呈指数级上升。你需要管理的是一个宏大的社会基础设施系统。

在这个维度里,你会遇到:

  • 频率复用(Frequency Reuse)与干扰协调: 国家分给运营商的频谱资源是极其有限的,不可能每个基站用不同的频率。相邻的基站如果用相同的频率,处于两座基站交界处(小区边缘)的用户就会被严重的干扰折磨。基站之间如何互相妥协、如何控制各自的发射功率,这是一门极其精巧的艺术。
  • 切换(Handover): 当你坐在一辆高速行驶的汽车上打一通长达半小时的电话,你的手机其实已经默默地在十几个基站之间进行了接力传递。如何在上一个基站信号变弱,下一个基站信号变强的那零点几秒内,毫无波澜地把你的通话数据迁移过去,这是 3G 软切换和 4G 硬切换需要解决的核心难题。
  • 核心网(Core Network): 基站只是网络在空中的触手,真正的神经中枢在地下。所有通过基站接收到的无线数据,最终都要落地变成有线光缆里的比特,进入核心网,再被路由分发到互联网上的微信服务器、抖音服务器去。从电路交换(打电话)到分组交换(全 IP 上网),核心网的演进决定了移动通信的商业模式。

5. 交通系统的隐喻

如果在看完上面的解释后,你依然觉得这三层不够直观,那我们不妨使用一个贯穿全书的隐喻——交通系统

把我们每天用手机刷短视频的数据包,想象成一辆辆要在城市里穿梭的汽车。

  • 第一层:无线链路原理,研究的是“一辆汽车怎样跑得稳、跑得快”。
    • 调制是这辆车的发动机,决定了它一脚油门能跑多快。
    • 信道编码是这辆车的轮胎、安全气囊和防撞钢梁,决定了它在坑洼泥泞的道路(有噪声的信道)上行驶时,即使发生了轻微的刮擦,也不至于车毁人亡(数据无法恢复)。
    • 信道就是那条不可预测的道路。有些路是平坦的高速,有些路是满是坑洼的山道(多径衰落)。
  • 第二层:多用户空口原理,研究的是“一个极其繁忙的十字路口怎样调度车流”。
    • 多址(FDMA/TDMA/CDMA/OFDMA) 是十字路口的车道划分方案。是给每个人画一条专属车道?还是大家排队共用一条车道?还是修建复杂的立交桥?
    • 调度 就是站在路口中心那个智商绝顶的交警,他根据每一辆车的目的地、当前的拥堵情况(信道状态信息),以毫秒为单位疯狂挥手,指挥车辆通行,确保整体效率最高。
    • MIMO 就像是在原本二维的路面上,强行搭起了两层甚至三层高架桥,让车流可以在垂直的立体空间里同时穿梭。
  • 第三层:蜂窝网络原理,研究的是“一整座千万人口的超级城市,怎样规划其庞大的路网”。
    • 你不可能让所有的汽车只在一个十字路口打转。
    • 频率复用是城市片区的规划,确保这一个街区的拥堵不会蔓延到下一个街区。
    • 切换技术是如何保障一辆汽车从城东的高速公路跨越到城西的城市主干道时,能够顺畅地从一个交通管辖区过渡到另一个交通管辖区。
    • 核心网则是这座城市的高速公路网主骨架,它连接了所有的市区,并通往全国(互联网)。
graph TD
    A[移动通信系统] --> B[第三层:蜂窝网络原理<br>城市交通路网规划]
    B --> |包含与统筹| C[第二层:多用户空口原理<br>十字路口车流调度]
    C --> |支撑与下辖| D[第一层:无线链路原理<br>单辆汽车的性能与防护]

    D -.-> |核心技术模块| D1(信道编码 / 调制与解调 / 同步 / 信道均衡)
    C -.-> |核心技术模块| C1(多址技术 / 资源调度 / MIMO / HARQ机制)
    B -.-> |核心技术模块| B1(频率复用 / 干扰协调 / 跨区切换 / 全局核心网)

有了这张地图,你就拥有了“上帝视角”。

从 1G 的“大哥大”时代,到 2G 的数字语音,从 3G 试图拥抱数据,到 4G 引爆移动互联网,再到今天包罗万象的 5G,甚至未来的 6G。真正变化的,从来都不是某一个孤立的魔法公式的诞生,而是这三层系统在新的业务需求和新的硬件算力下,一次又一次被推倒重来、重新权衡、重新设计。

每一代通信技术的更迭,都是在“单车性能”、“路口通行率”和“城市路网规划”上同时进行的一场革命。

如果我们在接下来的篇章里,遇到了令人头晕目眩的推导,请不要害怕。只要紧紧抓牢这张地图,问一问自己:“我们现在到底是在研究汽车零件,还是在指挥交通?”一切数学的迷雾都会消散。

现在,带好这张地图。我们要推开第一扇大门,从最底层的第一条链路开始,看看香农(Claude Shannon)是如何在 1948 年的一张纸上,为全人类的通信规定了不可逾越的物理极限的。


第二章:通信的本质——信息、噪声与不可逾越的香农极限

本章地图定位:第一层,无线链路原理。我们在这里不关心宏大的城市交通网,也不关心十字路口的调度。我们只关心:一辆车(一条信号)在充满迷雾和坑洼的道路上,究竟能跑多快?

1. 1948 年的那篇神作

在深入了解 5G 那些令人眼花缭乱的新技术之前,我们必须把时间的指针往回拨,回到现代通信技术的“创世纪”时刻。

那是 1948 年。那一年,第二次世界大战刚刚结束不久,晶体管(Transistor)才在贝尔实验室里被发明出来,世界上第一台通用计算机 ENIAC 才刚刚运行了两年,体积庞大到需要塞满整个房间。

在那一年,贝尔实验室的一位名叫克劳德·香农(Claude Shannon)的 32 岁数学家,在《贝尔系统技术杂志》上发表了一篇名为《通信的数学理论》(A Mathematical Theory of Communication)的论文。

这篇论文在当时并没有立刻引起全球的轰动,但随着时间的推移,人们逐渐意识到,这篇论文不仅仅是通信领域的一座里程碑,它简直就是现代数字世界的“大宪章”。

在香农之前,人类虽然已经发明了电报、电话甚至早期的无线电广播,但大家对“通信”的理解依然是非常模糊和经验主义的。工程师们觉得,通信就是“把声音或者波形传到远方”。如果信号听不清,那就加大发射功率;如果频道不够用,那就换一条线。

但香农不这么认为。他用一种近乎冷酷的数学视角,从根本上回答了三个终极问题:

  1. 我们到底在传输什么?(什么是信息)
  2. 为什么传输会出错?(什么是噪声)
  3. 我们传输的极限到底在哪里?(信道容量极限)

不夸张地说,从 1G 到 5G,无论人类的通信工程师们如何绞尽脑汁地发明诸如 OFDMA、Massive MIMO、Polar 码这些极其复杂的技术,本质上都只是在香农 1948 年划定的那个笼子里跳舞。

2. 剥开表象:到底什么是“信息”?

在移动通信系统的第一层(无线链路原理),我们首先要搞清楚,这辆“车”里装的货物到底是什么。

直觉告诉我们,我们传输的是声音、文字、图片或者短视频。但香农指出,这些都只是物理世界的表象。通信的本质,不是传输声音,也不是传输波形,而是**“传输消除不确定性的东西”**。

香农将热力学中的“熵(Entropy)”概念引入了信息学,提出了“信息熵”的伟大概念。

假设明天是抛硬币决定谁去洗碗,结果只有两种:“正面”或“反面”。在抛硬币之前,你是不确定的。当你得知结果是“正面”时,你的不确定性被消除了。这个“消除不确定性”的过程,就是信息。

为了度量这种信息,香农借用了一个由统计学家约翰·图基(John Tukey)发明的词:比特(Bit,Binary Digit 的缩写)

在信息论的视角下,无论是周杰伦的一首歌、李白的一首诗,还是一部 4K 高清复仇者联盟电影,剥去其情感和意义的外衣后,它们在物理本质上没有任何区别——它们全都是一串由 0 和 1 组成的比特流。

这是一种极其暴力的降维打击。

直觉层比喻

想象一下,你开了一家全球最庞大的物流公司(也就是移动通信网络)。以前,有的客户让你运活鱼(语音波形),有的让你运易碎的玻璃杯(传真波形)。你必须为每一批不同的货物设计完全不同的卡车和减震系统。

但香农走过来说:“停下。从今天起,不管是活鱼还是玻璃杯,全部给我打碎,装进绝对标准化的集装箱里。你的卡车不需要知道里面装的是什么,它只需要负责把这些标准集装箱(比特流)安全地运到目的地,接收方会自己把它们拼装还原。”

这就是数字通信的本质。在 4G 和 5G 的全 IP 化网络里,基站根本不关心你在打微信语音还是在刷抖音,它眼里的世界,只是每秒几百兆的比特风暴。

3. 为什么通信那么难:与噪声的永恒战争

既然万物皆可比特化,那通信不就简单了吗?就像在电脑上把一个文件从 C 盘复制到 D 盘一样,0 还是 0,1 还是 1,传过去不就好了。

不幸的是,移动通信使用的是空气。

空气(或者说自由空间),是人类能找到的最糟糕的传输介质。在这条无形的公路上,充满了劫匪、大雾和坑洼。在通信专业里,这些统称为噪声(Noise)与干扰(Interference)

  • 热噪声(Thermal Noise): 即使你躲在宇宙深处的真空中,只要温度高于绝对零度,接收机内部的电子就会做无规则的热运动,产生随机的电流起伏。这是大自然强加给所有电子设备的底噪,永远无法消除。
  • 衰落(Fading): 电磁波在空气中传播,就像是在迷雾中扔手电筒。光线会随着距离迅速衰减。在真空中,电磁波的能量随距离的平方成反比衰减;而在城市里,甚至可能以三次方或四次方衰减。
  • 干扰: 除了你,满大街还有无数个路由器、无数部手机、甚至微波炉和汽车火花塞都在向外辐射电磁波。

所以,移动通信的真相并不是完美的复制粘贴。它是发送端在狂风暴雨中用手电筒向远方打摩斯密码,而接收端在极度模糊的噪点中,试图猜测刚才闪过的那一下到底是 0 还是 1。

4. 全书最核心的公式:香农定理

如果空气这么糟糕,那我们的通信速度是不是注定极其缓慢?我们到底能把网速提高到多少?

这正是香农论文最伟大、也最令人绝望的地方。他用一个极其简洁、极具对称美的数学公式,为全人类的信息传输画下了一条不可逾越的红线。

这本《重新理解移动通信》不会堆砌毫无意义的数学推导,但这个公式,你必须直面。因为如果不理解它,你永远无法理解为什么 4G 和 5G 要采用那么多看似匪夷所思的技术。

它就是香农信道容量公式(Shannon Capacity Formula)

$$ C = B \log_2\left(1 + \frac{S}{N}\right) $$

请你把目光在这个公式上停留十秒钟。它是如此的简洁,甚至没有任何微积分的符号,但它却蕴含着移动通信领域至高无上的真理。让我们像解剖青蛙一样,把这个公式切开来看:

$C$:信道容量 (Channel Capacity)

这是你想知道的最终答案。它的单位是 比特/秒 (bps)。它代表了在这条特定的无线信道上,你理论上能达到的最大无差错传输速率。这就是我们通常说的“网速极限”。无论华为、高通还是爱立信的工程师有多聪明,他们造出的设备的网速,永远不可能超过这个 $C$。

$B$:带宽 (Bandwidth)

它的单位是赫兹 (Hz)。你可以把它直观地理解为**“马路的宽度”**。

  • 如果你的马路只有 10 兆赫兹(10 MHz)宽,哪怕你的车速再快,单位时间内能跑过去的汽车总数也是有限的。
  • 香农公式告诉我们,信道容量 $C$ 和带宽 $B$ 成严格的正比例关系。你想让网速翻倍?最简单粗暴的办法就是去向国家无线电管理委员会申请,把你的频率带宽翻倍。

$S$:信号功率 (Signal Power)

这是你发射信号的强度,可以理解为**“你在大喊大叫时的音量”**。

$N$:噪声功率 (Noise Power)

这是环境中所有背景噪音和干扰的总和,可以理解为**“你周围环境有多吵”**。

$\frac{S}{N}$:信噪比 (Signal-to-Noise Ratio, SNR)

这是一个极其关键的概念。香农公式告诉我们,决定网速的,不是你绝对的声音有多大($S$),而是你的声音相对于环境噪音有多大($S/N$)

  • 在极其安静的深夜($N$ 很小),你只要轻轻耳语($S$ 很小),对方也能听清极度复杂的情话(传达大量信息)。
  • 在震耳欲聋的重金属演出现场($N$ 极大),你哪怕用大喇叭吼破喉咙($S$ 极大),对方也只能听懂你是在喊“加油”还是“停下”(只能传输极少的信息,比如 1 个比特)。

$\log_2(1 + \frac{S}{N})$:频谱效率

这部分数学表达的是,你在 1 赫兹的带宽上,能塞进去多少个比特。注意这里的对数函数 $\log_2$。这是一个极其残酷的数学规律——边际效应递减

  • 当信噪比 $S/N$ 很小的时候,你稍微增加一点点发射功率 $S$,网速 $C$ 就会明显上升。
  • 但是,当信噪比已经很大的时候,你为了把网速 $C$ 再提高一点点,你必须成倍、成百倍地增加发射功率 $S$。这在现实中是不可接受的,因为手机电池只有 4000 毫安时,基站也不能变成一个巨大的微波炉把周围的人烤熟。

5. 1G 到 5G:一场围绕香农极限的突围战

在了解了香农公式之后,我们再回过头来看 1G 到 5G 的发展史,你会有种拨云见日的清晰感。

从宏观上看,人类过去四十多年的移动通信史,就是所有的天才工程师们,盯着这个公式 $$ C = B \log_2(1 + \frac{S}{N}) $$,想尽一切办法把 $C$ 搞大的历史。

为了让 $C$ 变大,无非就是三个方向:

方向一:疯狂增加 $B$(带宽)
既然 $C$ 与 $B$ 是正比关系,那找更宽的马路就行了。

  • 为什么 1G 和 2G 时代我们在 900MHz 附近打转?因为那时候技术不成熟,做不了高频。带宽很窄,所以只能发文字短信和极慢的 2G 网页。
  • 为什么 5G 要搞毫米波(Millimeter Wave)?不是因为毫米波有什么神奇的魔力,仅仅是因为在 26GHz 到 39GHz 的超高频段上,还有大段大段没有人用过的“空地”。5G 可以轻而易举地在那里划出 400MHz 甚至 800MHz 的超大带宽 $B$。带宽一旦翻个十倍,网速 $C$ 闭着眼睛也能涨。

方向二:拼命提高 $S/N$(信噪比)
带宽再大也是有限的,国家分配频谱是要收百亿千亿授权费的。既然马路不能无限拓宽,那就想办法提高信噪比。

  • 怎么提高 $S$?最简单的是加大功率,但这会导致同小区干扰和电量耗尽。
  • 怎么降低 $N$?工程师们发明了极度复杂的信道编码(如 Turbo 码、LDPC 码),通过巧妙的数学冗余,强行在巨大的噪声 $N$ 中把信号 $S$ 捞出来。
  • 还有没有更聪明的办法?有。既然漫无目的地广播信号浪费能量,那基站能不能用几十根天线组成一个矩阵,把电磁波的能量像手电筒光束一样,精准地“打”到某一个人的手机上?这就是 5G 里的波束赋形(Beamforming),它极大地提高了到达用户手机的信号功率 $S$,同时减少了对其他人的干扰 $N$。

方向三:开辟公式之外的新维度(MIMO)
当带宽 $B$ 买不起了,信噪比 $S/N$ 也逼近极限了,怎么办?
这就是 4G 到 5G 核心技术 MIMO(多输入多输出) 登场的时刻。MIMO 的本质,是不在原有的单车道上死磕,而是在空间维度上,凭空建起了一层层高架桥。如果一根天线的极限是 $C$,那我用 4 根收发天线在空间中独立传输,总容量就变成了近似的 $4 \times C$。

6. 小结:通向直觉的桥梁

香农公式就像是通信界的“光速不可超越定律”或“热力学第二定律”。

它高悬在所有工程师的头顶,无情地嘲笑着一切试图用永动机(无限网速)忽悠大众的谎言。但正是这条红线,逼迫着人类发明了极其精妙的数学与工程技巧,在螺蛳壳里做道场,硬生生地把从前只能传输电报声音的无线信道,拓宽成了足以支撑实时 4K 视频直播的超级数据公路。

我们在这一章里搞清楚了通信的本质:在一条充满噪声的公路上,我们能把带有信息的标准化集装箱(比特)运多快,是有严格的物理极限的。

那么,下一个问题来了。

在我们知道了理论极限后,回到物理世界的现实操作中,这些肉眼看不见、摸不着的“0”和“1”的比特,究竟是如何跨越空气的鸿沟,从手机的芯片里飞跃到基站的天线上的呢?空气又不是一根网线,你不可能在空气里通电。

为了解决这个问题,我们需要进入第一层(无线链路原理)的第二个关键环节。我们要让信息“骑”上一匹隐形的烈马。

这匹马,叫做载波。而骑马的技术,叫做调制(Modulation)

请继续跟随我们的地图,进入第三章。


第三章:让信息骑上电波——调制与解调

本章地图定位:第一层,无线链路原理。在上一章,我们搞清楚了车里装的“集装箱(比特)”能跑多快。在这一章,我们要解决这辆车到底是怎么跑起来的。比特是看不见摸不着的数字概念,它们到底是怎么变成能在空气中飞行的物理实体的?

1. 为什么不能直接对着空气大喊大叫?

在信息论的世界里,所有的声音、文字和视频都已经被无情地碾碎成 0 和 1 的比特流。这是数学的胜利。但在物理世界里,比特是没有质量、没有体积的逻辑概念,它就像你的一个念头,你不可能直接把一个念头扔到几公里外的基站上。

如果你要传输你的念头,你必须借助某种物质或能量的载体。对于现代通信来说,这个唯一的载体就是电磁波

既然我们要把代表 0 和 1 的电信号(比如 0 伏特代表 0,5 伏特代表 1)发送出去,一个最直观、最简单的想法是:我直接买一根很长很长的天线,把手机里的 0 伏特到 5 伏特的电平变化直接“发射”到空气中去,不就行了吗?这叫基带传输(Baseband Transmission)

如果你用网线(比如双绞线或者同轴电缆)把两台电脑连起来,这种做法完全没问题。以太网里跑的就是基带信号。

但如果在“无线”通信里这么干,你会遇到一个极其致命的物理学定律灾难。

在无线电工程中有一个基本的常识:天线的长度,通常需要和它发射或接收的电磁波波长($\lambda$)在一个数量级上。(最理想的是四分之一波长)。

这里我们就必须引入一个高中物理公式,它极其简单,却死死地限制了天线的设计:

$$ \lambda = \frac{c}{f} $$

  • $\lambda$ 是波长(Wavelength,单位:米)。
  • $c$ 是光速(常数,约等于 $3 \times 10^8$ 米/秒)。
  • $f$ 是频率(Frequency,单位:赫兹 Hz)。

假设我们要把人们说话的声音直接变成电磁波发射出去。人声的频率很低,通常在 300 赫兹到 3400 赫兹之间。为了方便计算,我们假设语音电信号的频率 $f = 3000$ 赫兹($3 \times 10^3$ Hz)。

代入公式算一下:
$$ \lambda = \frac{3 \times 10^8}{3 \times 10^3} = 100,000 \text{ 米} = 100 \text{ 公里} $$

这意味着,如果波长是 100 公里,即使按照四分之一波长的设计,你的手机上必须竖起一根 25 公里长的天线,才能把你的声音直接以电磁波的形式发送出去!哪怕是奥特曼拿这种手机也嫌重。

这就是为什么我们绝对不能直接把低频的原始信息(基带信号)发到空气中。

2. 找一匹高频的烈马:载波

既然低频信号的波长太长,导致天线长得离谱,那解决办法呼之欲出:提高频率 $f$

如果我们用 3 GHz($3 \times 10^9$ 赫兹,这是 4G 和 5G 经常使用的频段)上发射信号,波长会是多少?
$$ \lambda = \frac{3 \times 10^8}{3 \times 10^9} = 0.1 \text{ 米} = 10 \text{ 厘米} $$

四分之一波长只有 2.5 厘米!完全可以极其轻松地隐藏在你的智能手机内部。这也是为什么现代智能手机外面再也看不到那一截丑陋的天线了。

所以,工程师们找到了一个绝妙的办法:

我们找一个频率非常高、极其稳定的纯净正弦波。这个正弦波除了频率极高(能让天线变短),没有任何其他的意义。它就像一匹强壮、跑得极快、但脑子里一片空白的烈马。这匹马,在通信里被称为**“载波(Carrier Wave)”**。

然后,我们把那些低频的、波长极长的信息比特(我们的信件),想办法“绑”到这匹高频烈马上,让马驮着信跑向远方。

这个把信息绑到载波上的过程,就叫调制(Modulation)。当马跑到基站后,基站把马背上的信件解下来,恢复出原始的比特流,这个过程就叫解调(Demodulation)

3. 如何绑架一匹正弦波?

那么,如何在一匹平滑的正弦波烈马上,做出 0 和 1 的标记呢?

这就需要第二个必须面对的公式。一个完美的、毫无杂念的余弦波(或者正弦波),在数学上只能被三个参数唯一决定:

$$ S(t) = A \cdot \cos(2\pi f t + \phi) $$

在这把手术刀般的公式里:

  • $A$ 是幅度(Amplitude): 也就是波浪的最高点有多高,对应马的“高矮”。
  • $f$ 是频率(Frequency): 波浪在一秒钟内震动的次数,对应马跑的“步伐快慢”。
  • $\phi$ 是相位(Phase): 也就是波浪在时间零点时的起始位置,对应马起跑时的“抬腿姿势”。

除了这三个维度,电磁波再也没有任何可以被改变的物理属性了(如果不考虑偏振的话)。所以,我们要想把 0 和 1 藏进电磁波里,只能、且必须在这三个参数上做手脚。

调幅、调频与调相

  1. 调幅(AM/ASK):控制载波的高矮

    • 调制公式:$S(t) = [A + m(t)] \cos(2\pi f_c t)$
    • 工程例子:假设我们要传一个正弦波音频 $m(t)$。基带信号的起伏直接改变了载波的振幅。如果是数字信号(ASK),我们设定传“0”时振幅为 1V,传“1”时振幅为 5V。
    • 如何解调(解聘):最简单的方法是包络检波(Envelope Detection)
      • 公式:$y(t) = \text{LPF}(|S(t)|)$。
      • 直觉:在接收端用一个二极管把波形的下半部分切掉,再用电容平滑一下,就像用砂纸磨掉毛刺,剩下的“轮廓”就是我们要的原始信息。
  2. 调频(FM/FSK):控制载波的步伐

    • 调制公式:$S(t) = A \cos(2\pi [f_c + k \cdot m(t)] t)$
    • 工程例子:传“0”时让载波以 1.0MHz 震动,传“1”时让它加速到 1.1MHz。
    • 如何解调:使用**鉴频器(Frequency Discriminator)**或锁相环(PLL)。
      • 公式:$y(t) \propto \frac{d\phi(t)}{dt}$。
      • 直觉:接收端像一个极其灵敏的节拍器,一旦发现载波跑快了,就输出高电平;跑慢了,就输出低电平。FM 的抗干扰能力极强,因为噪音很难改变波形的“疏密”。
  3. 调相(PM/PSK):控制载波的抬腿动作

    • 调制公式:$S(t) = A \cos(2\pi f_c t + \Delta\phi \cdot m(t))$
    • 工程例子(BPSK):传“1”时波形正常起跳(相位 0),传“0”时波形反转 180 度(从谷底起跳)。
    • 如何解调相干解调(Coherent Demodulation)
      • 公式:$S(t) \times \cos(2\pi f_c t) = \frac{A}{2} [\cos(\phi) + \cos(4\pi f_c t + \phi)] \xrightarrow{\text{LPF}} \frac{A}{2} \cos(\phi)$。
      • 直觉:基站手里也拿一匹频率完全一样的“本地载波”,让收到的信号和本地载波“合体”。如果步调一致(同相),输出就是大信号;如果步调相反(反相),输出就是负信号。

在很长一段时间里,人们就是用这三种最基本的方法来传输数据的。但如果你只用这三种基本招式,网速是非常感人的。因为在每一个时刻的波形变化里(我们称之为一个符号,Symbol),你只能区分两种状态(0 和 1),所以一个符号只能携带 1 个比特。

要怎么提高网速?回想香农公式。在带宽一定的情况下,我们要榨干信道的容量。既然幅度 $A$ 可以变,相位 $\phi$ 也可以变,那我们能不能把它们同时变

4. QAM 的魔法:在刀尖上跳舞

这就是移动通信历史上极其伟大的一步:正交幅度调制(QAM, Quadrature Amplitude Modulation)

在前面的章节中,我们提到了幅度和相位的独立调整。但在工程实现中,这种“既要马儿跑得快,又要马儿步伐齐”的控制是非常低效的。工程师们发明了一种极其精妙的数学手段,让电磁波在同一个频率上“分身”——这就是 I/Q 调制

在数学上,任何一个带有特定幅度和相位的余弦波,都可以分解为两个互相垂直(正交)的波形:
$$ S(t) = I(t) \cos(2\pi f_c t) - Q(t) \sin(2\pi f_c t) $$

这就是 QAM 的“核心解剖刀”:

  • $I(t)$ (In-phase):同相分量。
  • $Q(t)$ (Quadrature):正交分量(相位移动了 90 度)。

为什么这很重要?
因为在数学上,正弦波和余弦波是正交的。这意味着即使它们频率完全一样,它们在叠加后也不会互相干扰。

具体是怎么拆分的?
接收端只需要祭出两把“数学剪刀”——两路本地载波(一路是 $\cos$,一路是 $\sin$):

  1. 提取 $I$ 路:将收到的混合信号 $S(t)$ 乘以 $\cos(2\pi f_c t)$。
    $$ [I \cos - Q \sin] \cdot \cos = I \cos^2 - Q \sin \cos = I \left( \frac{1+\cos 4\pi f_c t}{2} \right) - Q \left( \frac{\sin 4\pi f_c t}{2} \right) $$
    通过一个低通滤波器(LPF)滤掉那个 $4\pi f_c$ 的高频分量后,剩下的只有 $I(t)/2$。
  2. 提取 $Q$ 路:同理,将 $S(t)$ 乘以 $-\sin(2\pi f_c t)$。由于 $\sin$ 和 $\cos$ 的乘积在积分周期内为 0,所有的 $I$ 路分量会瞬间消失,只剩下 $Q(t)/2$。

这就好比你左手拿红色滤镜,右手拿绿色滤镜,一眼就能从重叠的图像中分别看清红色和绿色的线条。

不断提高 $M$(星座图密度),是如何强行拉高比特数的?
这就是**“标签”**的魔力。
在通信中,一个波形的变化周期(一个符号)就像一个空集装箱。

  • 如果是最简单的 BPSK,集装箱只有两种状态(左或右),我们只能贴上“0”或“1”这两个标签。一个箱子装 1 比特
  • 如果是 16QAM,我们在复平面上画出了 16 个不同的坐标点(即 16 种不同的 $I/Q$ 幅度组合)。每一个坐标点都对应一个唯一的 4 位二进制密码(因为 $2^4=16$)。比如点 A 代表 0101,点 B 代表 1100
  • 到了 256QAM,我们在同样的“箱子”里区分出了 256 种极其细微的状态。为了给这 256 个点贴上不重名的标签,我们需要 8 位二进制数(因为 $2^8=256$)。

所以,提高 $M$ 的本质,是利用更高的信噪比(更敏锐的眼力),让每一个符号能代表更多的逻辑状态。在同样的带宽 $B$(每秒运送的箱子数不变)下,每个箱子里装的信息量从 1 比特变成了 8 比特。这就是为什么 5G 比 2G 快那么多的核心奥秘之一:它不再是跑得更快,而是每个集装箱装得更满。

QAM 的本质,就是通过分别控制 $I$ 路和 $Q$ 路的幅度(即不同的 $I/Q$ 坐标值),在二维复平面上拼凑出各种复杂的点阵。

  • 16QAM:$I$ 和 $Q$ 各有 4 个电平状态,组合起来就是 $4 \times 4 = 16$ 种状态,每符号携带 4 比特。
  • 256QAM:$I$ 和 $Q$ 细分出 16 级电平,组合出 256 个点,每符号携带 8 比特。

这把“解剖刀”切中了香农公式的哪一部分?
它切中的是频谱效率(Spectral Efficiency),即 $\eta = C/B = \log_2(M)$。QAM 调制的使命,就是在不增加带宽 $B$ 的前提下,通过不断提高 $M$(星座图的密度),强行拉高单位频带内传输的比特数。

直觉层比喻

我们可以把 QAM 调制看作是在远处看人脸识别情绪

最简单的 BPSK(两种相位),就像是在判断远处的交警是“举着左手”还是“举着右手”,一目了然。

16QAM 就像是你要看清远处的交警不仅举了哪只手,还要看清他比划的是“1、2、3、4”中的哪一个。

256QAM 则变态到了极点:你不仅要看清他举的哪只手、比划的数字,你还要看清他嘴角上扬的弧度到底是 15 度还是 17 度。这就要求你的眼力(信噪比 SNR)必须极好,否则稍微一点风吹草动(噪声),你就会看错。

5. 理想很丰满,噪声很骨感

既然 QAM 阶数越高,网速快,那我们为什么不直接搞 100 万阶 QAM,让网速突破天际呢?

这个时候,第一章里一直悬在头顶的幽灵——香农公式——冷冷地出现了:

$$ C = B \log_2\left(1 + \frac{S}{N}\right) $$

请注意,QAM 星座图里的点越多,它们之间的距离就越拥挤。这就意味着,微小的幅度波动或相位偏移,都会导致接收端把“A 状态”误判成旁边挨着它的“B 状态”。

而在无线空气信道中,我们前面说过,充满了噪声(N)多径衰落

噪声在物理上的表现,就是把原本精准落在棋盘某个格子里的电磁波状态,随机地往四周扯动。

  • 如果你用的是最简单的 2 阶调制(BPSK),由于状态只有两个,就算噪声把波形弄乱了一点,接收端也能清晰地判断出是左边还是右边。这就解释了:为什么在信号极其微弱、噪声极大的地下室里,即使只有一格信号,你也能发出去一段文字微信(虽然很慢,但极其可靠),却打不开一张图片。因为此时基站为了保证不断线,主动把你的调制方式降级到了最抗造的低阶调制。
  • 但如果你用的是 256QAM 甚至更高,星座点之间近在咫尺。稍微一点点热噪声的扰动,或者由于接收机高速移动(高铁上)带来的多普勒频移导致相位稍微歪了一点点,接收端就会彻底认错,导致这 8 个比特全部报废。这就叫误码率(BER,Bit Error Rate)飙升

所以,高阶 QAM(极高的速率)只有在一种情况下才能使用:信道必须极其干净,信号功率 $S$ 必须极大,噪声 $N$ 必须极小。也就是信噪比 $S/N$ 极高的时候。

你在 4G 或 5G 手机上测出的那种几百兆的巅峰网速,通常只有当你站在基站的正下方,没有任何遮挡,而且旁边没有人跟你抢网速的时候,基站才会奢华地为你开启 256QAM。

6. 收缩阵型:准备进入信道保卫战

在这一章,我们把冰冷的数字比特,通过调幅和调相的魔术(QAM),成功地绑在了一匹频率高达几个吉赫兹(GHz)的载波烈马上,把它们射向了广袤无垠、充满噪声的空气中。

但这仅仅是万里长征的第一步。

当这匹烈马在城市的高楼大厦之间穿梭时,它不仅会遇到无所不在的白噪声,它还会撞在玻璃幕墙上、柏油马路上、行道树的叶子上,碎裂成无数条大大小小的回声。这些不同时间到达的电磁波残影,会像海啸一样冲刷在接收端的天线上。这就是整个移动通信中最恶毒的魔鬼:多径衰落

如果不能降服多径衰落,所有的 QAM 星座图都会变成一锅彻底糊掉的马赛克。

在下一章,我们将看看当年的 3G 时代的巨头们(比如大名鼎鼎的高通),是如何通过数学技巧在废墟中重建信号的;以及 4G 时代又是用怎样一种极其天才的、违背直觉的手段,将这个困扰了人类几十年的幽灵彻底斩杀的。

我们将进入第四章:真实世界的信道——多径、衰落与均衡


第四章:真实世界的信道——多径、衰落与均衡

本章地图定位:第一层,无线链路原理。在上一章,我们把冰冷的比特绑在了一匹被称为“载波”的高频烈马上。现在,这匹马冲出了天线,进入了真实的世界。本章将讲述它在这个世界里遭遇的致命伏击,以及工程师们如何把它从死神手里抢回来。

1. 离开温室的烈马

在传统的通信原理教材里,很多公式推导的前提都是一个“理想的高斯白噪声信道(AWGN)”。在这个温室般的数学模型里,接收信号可以简单写成:

$$ y = x + n $$

也就是说,接收端收到的东西($y$),仅仅是发送信号($x$)加上了一点均匀分布的噪声($n$)。如果世界真这么简单,通信工程师只需要想办法通过加大功率或改进算法来对抗噪声就够了。

但现实极其残酷。

当载波这匹烈马冲出基站天线的那一瞬间,它面对的是一个充满了玻璃幕墙大厦、钢筋混凝土丛林、呼啸而过的汽车、甚至行道树叶子的复杂几何迷宫。在这个迷宫里,信号不会只沿着一条路到达手机,它会发生反射、绕射和散射。

于是,真实世界里接收端收到的信号更像是:

$$ y(t) = a_0x(t) + a_1x(t-\tau_1) + a_2x(t-\tau_2) + n(t) $$

这里的 $a_0x(t)$ 是直达信号,$a_1x(t-\tau_1)$、$a_2x(t-\tau_2)$ 是晚一点到达的反射信号(回声)。也就是说:接收端听到的不是一句干净的话,而是一句话加上许多回声。 这就是无线通信史上最恶毒的诅咒——多径效应(Multipath Effect)

2. 魔鬼的重影:符号间干扰(ISI)

如果发送速度不快,这些回声还可以忍受。可一旦我们要追求高速率,符号发得极快,每一个符号在时间上变得极其短暂。

假设你现在语速极快,第一个字“我”的直射径刚刚到达接收端,紧接着它的反射回声也到了。但这回声恰好撞上了你紧接着喊出的第二个字“爱”的直射径!于是接收端收到的第二个符号可能变成:

$$ y_2 = x_2 + \alpha x_1 + n $$

真正想接收的是 $x_2$,但里面混进了前一个符号 $x_1$ 的残影($\alpha x_1$)。这就是符号间干扰(ISI,Inter-Symbol Interference)

ISI 的本质,就是接收当前符号时,混进了前面符号的尾巴。 当传输速率极高时,几十个符号的残影会由于多径效应彻底揉碎在一起。不管你用多么高级的 QAM 调制,接收端看到的星座图都会变成一团彻底糊掉的面糊。

3. 频率选择性衰落:被啃噬的带宽

多径效应还在频域上制造了另一个魔鬼。由于到达接收天线的有直射波和反射波,它们走过的距离长短不一。当两列波在空间中相遇时,如果波峰和波谷对齐,能量会互相抵消。

这导致在一个宽带信号(比如 20MHz)里,有的频率信道极好,有的频率信道却衰减得极其严重。这种现象叫作频率选择性衰落。它是所有宽带移动通信系统必须跨越的一座大山。

4. 均衡:反向补偿的艺术

既然信道把信号扭曲了,接收端最直觉的想法就是:信道怎么扭曲我,我就怎么反向补回来。

如果信道只是简单地把信号乘了一个影响因子 $h$:
$$ y = hx + n $$
那么接收端就可以尝试除以 $h$ 来恢复信号:
$$ \hat{x} = \frac{y}{h} $$

这就是**均衡(Equalization)**最朴素的思想。

  • 直觉比喻:信道是一副把你眼睛看瞎的哈哈镜,均衡器就是一副反向哈哈镜。只要这两副镜子的扭曲程度恰好相反,你就能重新看到真实的世界。

在 3G 时代,CDMA 阵营还祭出了 RAKE 接收机。它像一把钉耙,主动把不同时间到达的 $a_ix(t-\tau_i)$ 收集起来,在时间上对齐后重新叠加。原本的干扰回声,反而变成了增强信号的能量!

5. OFDM 与 CP:把大问题拆小

当我们要实现百兆以上的网速时,传统均衡器因为计算量太大而崩溃了。这时,OFDM(正交频分复用) 降临了。

OFDM 的聪明之处在于:不要让一个高速信号硬扛多径,而是把它拆成许多个低速小信号。
它把一条极快的高速公路拆成 1200 条慢速小巷子。符号变长以后,多径回声相对就变短了。

为了彻底消除干扰,OFDM 还引入了循环前缀(CP)——给每个符号前面加一个“缓冲垫”。只要满足:

$$ T_{CP} > T_{echo} $$

即保护区长度大于回声拖尾长度,那么前一个符号的回声就会全部砸在 CP 缓冲垫上,而不会伤害到真正的数据。接收端只需要把被污染的 CP 丢掉,剩下的就是纯净的信号。

6. 本章总结

这一章,我们从理想走向了现实:

  • 理想世界:$y = x + n$(信号只是被弄脏)。
  • 真实世界:$y(t) = \sum a_ix(t-\tau_i) + n$(信号变成了许多回声)。
  • ISI:$y_2 = x_2 + \alpha x_1 + n$(前一个回声污染后一个符号)。
  • 均衡:$\hat{x} = y/h$(反向补偿扭曲)。
  • OFDM + CP:$T_{CP} > T_{echo}$(用保护垫挡住回声)。

信号虽然经历了生死劫,但凭借这些工程奇迹,我们成功在废墟中重建了真理。然而,物理层不仅有多径,还有噪声导致的误码。下一章,我们将看看如何通过纠错码,在错误中寻找真相。

我们将进入第五章:纠错的艺术——从编码到逼近香农极限


第五章:纠错的艺术——从编码到逼近香农极限

本章地图定位:第一层,无线链路原理的最后一关。在前面的章节里,我们找到了载波烈马,学会了在马上做 QAM 标记,还用 OFDM 强行把被多径撕碎的道路给铺平了。但无论道路多平,天空中随机砸下的冰雹(高斯白噪声)依然会砸晕我们的马。在错码不可避免的现实中,我们如何保证接收端能够 100% 还原最初的真相?

1. 绝望的错码与通信的最后防线

让我们回忆一下第二章里的香农公式,以及那张密密麻麻的 256QAM 星座图。

当基站为了追求极高的网速,将大量的比特塞进同一个电磁波符号(Symbol)时,星座图上代表着 0 和 1 组合的点,会被挤压得极度密集。此时,天空中哪怕只是一道微弱的闪电产生的热噪声,或者一辆卡车驶过带来的微弱电磁干扰,都会像一只看不见的手,把原本对准了“A 坐标”的波形,无情地推向相邻的“B 坐标”。

接收端天线忠实地捕捉到了这个被推偏的波形。它的 ADC(模数转换器)尽力去解读,最后得出一个绝望的结论:这似乎是 B 坐标。

于是,原本应该是一个 10110000 的二进制密码,因为一个符号的误判,变成了 10110001。仅仅是最后 1 个比特的反转,对于模拟时代的语音电话来说,可能只是听筒里极其轻微的“嘶嘶”杂音,人耳会自动忽略。但在今天的移动互联网时代,它是极其致命的。这 1 个比特的错误,可能导致一个 10 兆大小的高清压缩视频包彻底解压失败,也可能导致微信支付协议里的效验码错误,让你直接被踢出网络。

在数字通信中,错码不是偶然,而是物理信道里永恒存在的必然。

如果只是靠无休止地加大发射功率(提高 $S$)来压制噪声($N$),不仅基站的电费吃不消,你的手机也会瞬间发烫死机。面对必将发生的错码,工程师们必须在信号的最源头,建立起最后一道、也是最坚固的一道防线——信道编码(Channel Coding)

2. 冗余换可靠:穿上防弹衣的比特

信道编码的核心思想极其简单,但却极其深刻:用冗余换取可靠性

我们来做一个非常直觉的比喻:假设你要在嘈杂的酒吧里,把“去”或者“留”这个信息(1 个比特)喊给对面的朋友听。如果你只喊一声“去”,在巨大的重金属音乐掩盖下,对方可能听成了“留”。于是你变聪明了,你连喊了三次:“去!去!去!”对方在巨大的噪音中,听到了“去!留!去!”。虽然中间有一个字被噪音扭曲成了“留”,但他大脑里会本能地做一个少数服从多数的投票机制,最终他准确地还原了你的意图:“他想说的是去。”

在通信原理中,这种做法叫做重复码(Repetition Code)。为了传输 1 个有效的比特,你硬生生地占用了 3 个比特的信道资源。这 2 个多出来的比特,就是**“冗余”**。通过加入冗余,你给脆弱的信息比特穿上了一件厚厚的防弹衣。即使在空气中被乱枪(噪声)扫射,只要致命部位没中弹,接收端就能把它救活。

但这件防弹衣太笨重了。重复码的效率实在太低,它直接把极其宝贵的信道容量(网速)砍掉了三分之二。在寸土寸金的无线频谱里,我们绝对不能容忍如此低下的效率。

因此,信道编码学界(又称纠错码理论),在其后的几十年里,成为了数学天才们疯狂角逐的修罗场。所有编码理论的终极目标只有一个:
如何用最少的冗余比特,纠正尽可能多的错误,并且在数学和工程上可实现?

3. 卷积码与维特比(Viterbi)的救赎

在 2G 和 3G 的早期时代,统治无线信道的是一种叫作**卷积码(Convolutional Code)**的经典技术。

与重复码那种简单的“复制粘贴”不同,卷积码的编码器像是一个拥有记忆的齿轮箱。当你输入当前这 1 个比特时,它不仅会根据当前这 1 个比特,还会根据前几个比特的历史状态,通过一组特定的异或(XOR)多项式方程,计算出 2 个或 3 个输出比特。

由于当前的输出结果和过去的历史紧密缠绕在一起(这就叫数学上的“卷积”),它把原本孤立的信息,变成了一条具有内在连续性逻辑的锁链。

如果在传输中,锁链的某一个环被噪声打碎了(发生了错码),接收端该怎么办?

这就必须提到现代通信史上最伟大的算法之一——由安德鲁·维特比(Andrew Viterbi)发明的 Viterbi 译码算法。维特比(他也是高通公司的联合创始人之一)提出了一种极其优雅的寻找真相的方法:网格图最大似然译码(Maximum Likelihood Decoding)

在接收端,维特比译码器并不去死磕那一个被打碎的比特,而是把收到的所有(包含错误的)比特序列摊开。因为它知道发送端生成这些比特时使用的“历史关联规则”,它会在网格图上画出所有可能合法的“正确路径”。然后,它把接收到的错误序列,去和网格图上所有可能合法的路径进行一一比对,计算它们之间的“距离”(通常叫汉明距离或欧氏距离)。最后,它挑选出那条与接收序列“距离最近、长得最像”的合法路径,大声宣布:“虽然你现在满身泥泞,但我知道,你最初出发时的样子,一定是这条路!”

Viterbi 译码算法完美地解决了卷积码的接收端盲猜难题,成为了整个数字通信时代的奠基石,广泛应用于手机、深空探测(如旅行者号探测器)甚至你家里的硬盘里。

4. 逼近香农极限:Turbo 码的神迹

然而,无论是卷积码还是早期的分组码,随着人们对网速的要求越来越高,工程师们发现了一个极其沮丧的事实:无论他们怎么改进网格图,怎么增加约束长度,系统的实际传输速率,距离 1948 年那个香农公式 $C = B \log_2(1+S/N)$ 所画下的红线(香农极限),始终还有好几分贝(dB)的遥远差距。

就在整个通信学界甚至开始怀疑“香农极限是不是永远无法企及的乌托邦”时,1993 年,两名名不见经传的法国工程师(Claude Berrou 和 Alain Glavieux)在日内瓦的一次学术会议上发表了一篇论文。

这篇论文像一颗核弹,彻底引爆了整个通信界。他们发明了 Turbo 码(涡轮码)

Turbo 码的结构其实非常简单粗暴,甚至一开始很多老派的密码学家觉得它在数学上不够“优美”。它的核心思想是:既然一个维特比译码器不够强,那我们就用两个软判决(Soft-Decision)译码器互相配合

想象一下,两个警察在审问同一个犯罪嫌疑人(接收到的充满错码的信号):

  • **A 警察(译码器 1)**看了一遍证据,他不是给出一个肯定的“是”或“否”,而是给出一个概率性的判断(软信息):“我觉得他有 70% 的可能说了真话”。
  • 他把这个 70% 的线索(也就是所谓的“外信息”)交给 B 警察(译码器 2)。B 警察本来有些犹豫,但结合了 A 警察的线索后,他的判断变得更准确了,他说:“结合你的线索,我觉得他有 85% 的可能说了真话。”
  • 然后 B 警察又把这个 85% 的线索交还给 A 警察。
  • 如此循环往复。这就好像引擎里的废气被反复利用推动涡轮增压(Turbo)一样,经过几次迭代交换信息,原本隐藏在巨大噪声中的微弱真相,就像洗去泥沙的金子一样,被奇迹般地提纯了出来。

在 1993 年的那次测试中,Turbo 码在误码率为 $10^{-5}$ 时,距离香农的理论极限仅仅差了不到 0.5 dB。

人类用了整整 45 年的时间,终于第一次真正触摸到了通信理论的物理极限。随后,Turbo 码毫不意外地成为了 3G 和 4G(LTE)时代数据信道的绝对主宰。你能在 4G 手机上看高清视频,军功章里有一半属于 Turbo 码。

5. 5G 时代的决战:LDPC 与 Polar 码的冰与火之歌

既然 Turbo 码已经这么强了,为什么 5G 要抛弃它?

原因是,当进入 5G 时代后,我们需要支持高达 1Gbps 甚至 10Gbps 峰值的极速网络,甚至要求在极低时延下完成车联网的控制。这时候,Turbo 码的那个致命缺陷暴露出来了:它必须靠两名警察来回迭代传递信息,它太慢了。 Turbo 码的译码过程由于迭代的存在,难以实现高度并行的硬件流水线操作,它的处理时延和极高吞吐量无法满足 5G 恐怖的需求。

于是,在制定 5G 国际标准(3GPP Release 15)的过程中,爆发了那场载入史册的、惊心动魄的信道编码标准之战。

在这场战役中,两个沉寂已久的“冷门天才”站上了历史的舞台:

第一位候选人:LDPC 码(低密度奇偶校验码)
它其实早在 1962 年就被罗伯特·加拉格(Robert Gallager)在博士论文里发明出来了,但因为当时根本造不出能运行这种算法的巨型芯片,被彻底埋没了 30 多年。LDPC 码的奇偶校验矩阵非常稀疏(里面绝大多数都是 0)。这种看似松散的结构带来了一个极其霸道的优势:天然适合极其庞大的并行计算。如果说 Turbo 码是两个高级警探在抽丝剥茧,那么 LDPC 码就像是成千上万个普通巡警同时在瞬间对比口供。这让 LDPC 在面对 5G 需要传输的海量、长包数据时,译码速度和吞吐量一骑绝尘。最终,在高通、三星等巨头的支持下,LDPC 码拿下了 5G 增强移动宽带(eMBB)场景的“数据信道”绝对控制权

第二位候选人:Polar 码(极化码)
这是 2008 年由土耳其教授埃尔达尔·阿里坎(Erdal Arikan)提出的全新编码方式。它是人类历史上唯一一个能在数学上被严格证明能够达到香农极限的编码方法。它的核心物理思想极其玄妙:“信道极化”。通过极其精妙的数学组合,它强行把原本几个一模一样的平庸信道,极化成了“一部分极其完美的无噪信道”和“另一部分极其糟糕的废信道”。然后,聪明地把真实的业务数据全部扔进那些完美的信道里,而在废信道里塞满已知的废话(冻结比特)。Polar 码在处理非常短的、几十上百个比特的短数据包时,其可靠性和性能极其优越。最终,在中国华为等企业的全力推动和大量专利布局下,Polar 码历史性地突围,拿下了 5G “控制信道”的标准

这就是目前我们在 5G 标准规范里看到的明确结论:在 5G NR(New Radio)下,你刷短视频的巨大数据流,是由 LDPC 码在做纠错;而基站和你手机之间极其重要、极度敏感、决定你在哪里、如何调度的信令控制指令,是由 Polar 码在保驾护航。

6. 第一层地图:破关总结

至此,我们的第一篇:无线链路原理(点对点的魔法),终于画上了一个壮丽的句号。

回望我们在这一篇里走过的旅程,你会发现,这是一场在宏观与微观之间反复横跳的工程奇迹:

  1. 香农公式为我们划定了不容触碰的宇宙极限,宣告了带宽($B$)与信噪比($S/N$)的绝对王权。
  2. 为了对抗随时可能砸毁数据的白噪声,我们为脆弱的比特披上了 Turbo/LDPC/Polar 的重金属防弹衣。
  3. 我们寻找到了纯净的高频载波烈马,并用 QAM 调制的魔法,让马背上驮满了海量的包裹。
  4. 当烈马冲入城市,遭遇多径衰落这个致命的迷雾杀手时,我们祭出了 OFDM 与循环前缀(CP) 这把最不讲道理的屠龙刀,把时间强行拉长,把频域无情切分。

现在,这辆属于你个人的数据战车,已经拥有了极其强悍的防撞系统、极其暴力的引擎,以及极其先进的底盘悬挂。它足以在任何一条泥泞的、充满噪声的单车道上狂飙突进。

但是,只要你抬起头,你就会看到前方那条令人绝望的十字路口。

在那个路口,停着几十万辆和你一模一样、武装到牙齿的数据战车。空气只有这一份,频谱只有这一小段,如果大家同时踩下油门,只会引发一场玉石俱焚的超级连环车祸(信号互相彻底淹没)。

在这条拥挤的空气中,我们到底应该制定怎样的交通规则?基站又是通过怎样极其变态的调度大脑,让所有人都能感觉到“这条马路似乎是我一个人在独享”的错觉?

请带上你的地图,我们将跨入第二层。翻开下一页,欢迎来到第二篇:多用户空口原理——路口的博弈


第六章:多人共用空气——FDMA、TDMA、CDMA 与 OFDMA

本章地图定位:第二层,多用户空口原理。我们在第一篇搞定了单条信号的生存问题。现在,我们把视线拉高,不再只看一辆车,而是看整个十字路口。空气只有一份,当成百上千部手机同时试图和基站通信时,如果不加管制,所有的电磁波会撞成一团乱麻。如何制定极其高效的“交通规则”,让大家和谐共享空气?这就是**多址(Multiple Access)**技术。

1. 永恒的十字路口困境

假设你现在正站在一个巨大的圆形广场中央(基站),四周站着 100 个人(用户)。这些人都要同时向你汇报工作,而且广场上不能拉线,大家只能靠扯着嗓子喊。

如果你什么规则都不定,让 100 个人同时开口大喊。你会听到什么?
你会听到一阵极度嘈杂的轰鸣声,除了最靠近你、嗓门最大的那个人偶尔能蹦出几个词,其他人的声音全被互相淹没了。这在通信里叫做多用户干扰(Multi-User Interference)

在无线通信中,频谱资源(能用的电磁波频段)是极其稀缺和昂贵的。国家通常会把某一段几十兆赫兹宽的频段分配给某个运营商。基站和它下面所有的手机,都只能在这一段规定的“空气”里收发信号。

为了不让大家互相干扰,通信先驱们最先想到的两种办法,非常符合人类的直觉。

2. 切分频率与切分时间:FDMA 与 TDMA

第一种办法:频率切分(FDMA,频分多址)
这就像是你把那个 100 人的广场,用隔音板隔成了 100 个小房间。每个人在自己的小房间里喊,互相听不见。

在物理上,基站把分配到的那一大段频宽,像切西瓜一样,硬生生地切成一条条极窄的“信道”。数学表达上,不同用户的频率中心 $f_i$ 可以表示为:
$$ f_i = f_0 + i \cdot \Delta F $$
不同的用户 $i$ 占据着完全不重叠的频段。大家在各自专属的频率通道(Frequency Channel)里发信号,井水不犯河水。这被称为 FDMA(Frequency Division Multiple Access)。这就是 1G(模拟通信)时代采用的交通规则,简单、粗暴、有效。

第二种办法:时间切分(TDMA,时分多址)
房间如果不够切怎么办?那就换一种思路:排队。
你站在广场中央说:“所有人闭嘴!从现在开始,A 喊一毫秒,然后 B 喊一毫秒,以此类推。谁都不准抢跑。”

在数学上,用户 $i$ 被分配到的专属时隙范围是:
$$ t \in [i \cdot T_{slot}, (i+1) \cdot T_{slot}) $$
在这极短暂的 $T_{slot}$ 时间内,该用户独占所有的频率。只要切分的时间极度短暂,在人类的感知里,大家似乎都在同时连续地打电话。这就是 TDMA(Time Division Multiple Access)。2G 时代最伟大的王者——GSM 网络,其核心就是结合了 FDMA 和 TDMA。

但这两种切西瓜的方法有一个致命的缺点:资源利用率极低
无论是专属频率还是专属时隙,一旦分配给你,就算你这几秒钟一句话也没说,这个资源也是被你霸占的。这种“硬切分”严重限制了基站能容纳的最大用户数。

3. 数学的终极浪漫:CDMA(码分多址)的崛起

到了 3G 时代,以高通为首的天才工程师们,祭出了一套极度反直觉、充满数学浪漫气息的全新多址方案——CDMA。

CDMA 的哲学是:我不切频率,也不切时间。所有人,在同一个时刻,使用所有的频率,同时给我大喊大叫!

疯了吗?不会互相干扰吗?
会,但 CDMA 使用了数学上的“暗号”。

还是那个广场。100 个人同时开口,但他们用的语言完全不同。A 用英语,B 用斯瓦希里语,C 用克林贡语。如果你只懂英语,当这 100 个人的声音混合在一起传到你耳朵里时,那些你听不懂的语言对你来说,仅仅是背景中的“白噪声”。你只要开启大脑的“英语滤波器”,就能从极度嘈杂的背景音中,精准地剥离出那句英语。

在 CDMA 中,这种“语言”叫做正交扩频码(如 Walsh 码)
这个公式意味着:如果你把属于用户 $i$ 的密码和用户 $j$ 的密码对应位点乘并求和,只要 $i$ 和 $j$ 不是同一个人,结果绝对等于 0(完全抵消)。

让我们来看一个极简的计算例子:

假设广场上只有两个用户 A 和 B,基站给他们分配了长度为 4 的正交码(码片):

  • 用户 A 的暗号:$\mathbf{c}_A = [+1, -1, +1, -1]$
  • 用户 B 的暗号:$\mathbf{c}_B = [+1, +1, -1, -1]$
    (读者可以验算一下:$1 \times 1 + (-1) \times 1 + 1 \times (-1) + (-1) \times (-1) = 1 - 1 - 1 + 1 = 0$。它们确实是严格正交的。)

现在,两人同时发送信息比特 1

  1. 用户 A 扩频后:发出波形 $[+1, -1, +1, -1]$。
  2. 用户 B 扩频后:发出波形 $[+1, +1, -1, -1]$。
  3. 空气中的混合信号:基站接收天线感受到的是两者的叠加。
    把每一位加起来:$[1+1, -1+1, 1-1, -1-1] = [+2, 0, 0, -2]$。

此时,基站面对这串看起来乱七八糟的混合信号 $[+2, 0, 0, -2]$,如何找回用户 A?
解聘过程:基站拿出用户 A 的专属密码 $\mathbf{c}_A = [+1, -1, +1, -1]$,与混合信号对应位相乘:

  • 第一位:$2 \times 1 = 2$
  • 第二位:$0 \times (-1) = 0$
  • 第三位:$0 \times 1 = 0$
  • 第四位:$(-2) \times (-1) = 2$
  • 最后求和:$2 + 0 + 0 + 2 = 4$。

结果不为 0!基站据此判定:用户 A 刚才确实发了一个比特 1

更神奇的是,在刚才的计算中,用户 B 的信号在哪里?由于 B 和 A 是正交的,在基站用 A 的密码去“过滤”混合信号时,属于 B 的那一半贡献在求和过程中被完美抵消成了 0

即使空间中充满了别人的电磁波,只要基站用你的专属密码去乘收到的混合波形,别人的信号瞬间全部归零,只有你的信号会完美凸显出来!这简直是一个数学奇迹。

4. CDMA 的阿喀琉斯之踵:远近效应与功率控制

然而,上帝在馈赠奇迹的同时,也标好了价格。
CDMA 的数学虽然完美,但在物理世界里却遭遇了一个极其恶心的麻烦:远近效应(Near-Far Effect)

想象一下那个广场。如果那个说克林贡语的人就站在你耳朵边上大吼,而那个说英语的人站在一百米外嘀咕。哪怕克林贡语对你来说是噪音,这个噪音也太大了!它会彻底震聋你的耳朵,让你根本听不见那句微弱的英语。

在无线环境里,由于距离不同,到达基站的信号强度会有天壤之别。一旦某个离基站近的用户发射功率过大,他就会像一个刺眼的太阳,把同小区里其他微弱的星星(用户)彻底淹没,正交性被彻底破坏。

为了解决这个问题,CDMA 必须引入极其精密的功率控制(Power Control)机制。基站每秒钟要向所有手机发送 800 到 1500 次命令:“A,你声音太大了,小声点!”“B,你快听不见了,大声点!”基站必须极其精准地把每一个手机到达基站的信号能量,控制得绝对一模一样大。这种在刀尖上跳舞的机制是 3G 时代最核心的专利壁垒,但也让系统的复杂度和功耗极高。

5. 4G 的“背叛”:走向 OFDMA

当时代向 4G 迈进,我们需要几十兆甚至上百兆的网速时,CDMA 撑不住了。
速率一旦极高,多径效应产生的残影会由于时延扩展彻底扭曲波形的相位。原本在发射端设计得极其完美的“正交”扩频码,到达接收端时正交性已经荡然无存。

在这个历史的十字路口,4G 毫不犹豫地抛弃了 CDMA,转身拥抱了 OFDMA(正交频分多址)

我们在第四章讲过 OFDM 如何通过“把大马路切成 1200 条小巷子(子载波)”来抵御多径。OFDMA 其实就是 OFDM 的多用户版本。

它的逻辑极其优美:既然我已经切出了 1200 个不互相干扰的正交子载波。那么,我只要把这些子载波灵活地分给不同的用户用就行了!

  • 用户 A 在下视频,分给他 800 个子载波。
  • 用户 B 在发微信,分给他 10 个子载波。

这听起来很像 FDMA?不,传统的 FDMA 频道之间必须留出宽阔的“保护带”以防干扰。而 OFDMA 的子载波是相互重叠却又严格正交的!它的基石是子载波之间的正交公式:
$$ \int_{0}^{T_s} e^{j 2\pi k \Delta f t} \cdot e^{-j 2\pi m \Delta f t} dt = 0 \quad (k \neq m) $$
只要子载波频率间隔 $\Delta f = 1/T_s$,子载波就像齿轮一样紧紧咬合,既没有浪费一丝一毫的缝隙,又绝对不会互相干扰。

更绝的是,OFDMA 不需要像 CDMA 那样进行疯狂的极速功率控制,远近效应对它几乎没有杀伤力。这也就是为什么 4G 和 5G 再也见不到 CDMA 的影子。在高速宽带的战场上,OFDMA 完成了封神。

现在,子载波已经切好。但接下来的问题是:在这飞速流逝的几毫秒内,这些子载波到底该分给谁?这就需要请出空口的最强大脑——让我们进入第七章:调度的艺术


第七章:调度的艺术——基站如何分配无线资源

本章地图定位:第二层,多用户空口原理。我们在上一章用 OFDMA 把空气切分成了无数极其细小的“资源块”。本章,我们将探寻基站内部那个看不见的最强大脑——调度器,它是如何像一个疯狂的超级交警一样,以毫秒为单位,指挥成千上万辆数据战车在十字路口穿梭的。

1. 消失的“专线”与共享的十字路口

在老一代的通信工程师眼里,打电话是一件极其有安全感的事情。在 1G 和 2G 时代,当你拨通一个电话,基站就会在空中为你硬生生地拨出一条频率(FDMA)或者一个时隙(TDMA)。这条通道是你的专线。无论你是口若悬河,还是长时间沉默不语,这条专线都为你保留,别人休想占用哪怕一微秒。

但到了 4G(LTE)和 5G 时代,情况彻底改变了。移动网络从“打电话的网”变成了“上网的网”。

上网的数据流是极其“突发(Bursty)”的。你点击播放视频的那一秒,需要极其庞大的带宽;但接下来的几秒钟,视频在缓存播放,你可能根本不需要网络。如果你还要霸占着专线,那整个网络的资源将被彻底浪费。

所以,现代移动通信抛弃了专线制,走向了完全的共享与调度(Scheduling)机制
整个基站覆盖的小区(Cell),就像是一个永远没有红灯的超级十字路口。没有任何人拥有专属车道。你要过马路,必须听从十字路口中心那个“超级交警”的实时指挥。

2. 切分时空的积木:资源块(RB)

为了让交警能够指挥,首先要把道路标准化。在 4G 的 OFDMA 系统里,空气这种不可捉摸的物质,被在时间和频率两个维度上切成了极其微小的积木块。

这个基本单位,叫做资源块(RB,Resource Block)

  • 在频率轴上:一个 RB 包含了 12 个正交子载波(共 180kHz 带宽)。
  • 在时间轴上:一个 RB 持续的时间在 4G 中通常是 0.5 毫秒。

你可以把整个基站的可用频段想象成一堵极其巨大的墙。随着时间的推移,这堵墙被切分成了无数个长宽固定的砖块(RB)。基站要做的唯一一件事情,就是决定:在接下来的 1 毫秒里,把哪一块砖,分配给小区里的哪一部手机。

3. 超级交警的底气:信道状态信息(CSI)

既然要分砖块,基站怎么知道该分给谁?
这个调度绝不是盲目的抓阄。基站调度器之所以被称为最强大脑,是因为它拥有“全知全能”的视野。

这得益于一套极其精密的侦察系统。在你的手机和基站通信时,基站会时不时地在空气中撒下一些“侦察兵”——导频信号(Reference Signal)

当手机接收到这些导频信号时,它立刻就会发现信道的扭曲程度。手机会将这个信道质量量化成一个数字,通过上行信道向基站汇报:“我的信道质量指示(CQI)是 15 级!”

基站收到所有手机的汇报后,瞬间在脑海里形成了一张全小区的信道状态信息(CSI,Channel State Information)全息地图。在数学上,这个“路况好坏”最直接的衡量标准就是信干噪比(SINR)
$$ \text{SINR} = \frac{P_{\text{rx}}}{I + N} $$

  • $P_{\text{rx}}$ 是接收到的有用信号功率。
  • $I$ 是来自周围其他基站或用户的干扰功率。
  • $N$ 是热噪声。

4. 看菜吃饭:自适应调制编码(AMC)

掌握了每个人的路况后,基站交警打出了第一套组合拳——自适应调制编码(AMC,Adaptive Modulation and Coding)

  • 如果用户 A 站在基站正下方,路况极好(CQI 15)。基站直接给他挂上最高档的 256QAM 调制,并且把信道编码冗余降到最低。
  • 如果用户 B 躲在地下室,路况极差(CQI 2)。基站会把调制方式降级到最坚固的 QPSK,并且套上最厚重的纠错装甲。

AMC 的核心思想就是:看菜吃饭。信道好,就拿速度换容量;信道差,就拿速度换命。 这其实是对香农公式的一次现实逼近:
$$ C \approx B \log_2(1 + \text{SINR}) $$
AMC 确保了实际传输速率始终紧贴着由 SINR 决定的理论极限。

5. 公平与效率的极致博弈:比例公平算法

资源块(RB)只有那么多,到底先分给谁?

方案一:绝对公平(轮询调度,Round Robin)
A 用一毫秒,B 用一毫秒。这看似公平,但极其低效。如果刚好轮到信道极差的用户,他会长时间霸占 RB 却只传出极少的数据,全小区吞吐量会崩盘。

方案二:绝对效率(最大载干比,Max C/I)
谁的信道好,就把资源全给谁。这会导致“饿死边缘用户”,地下室的用户可能永远连不上网。

方案三:比例公平调度(Proportional Fair, PF)
这是现代基站采用的天才博弈算法。基站在决定优先级时计算一个比值:
$$ Priority_k(t) = \frac{R_k(t)}{\bar{R}_k(t)} $$

  • $R_k(t)$ 是用户 $k$ 当前可能达到的瞬时速率
  • $\bar{R}_k(t)$ 是用户 $k$ 在过去一段时间内的历史平均吞吐量

这个公式是管理学的巅峰:

  • 对于基站下的用户 A,他平时网速就快(分母大),优先级会被压低。
  • 对于地下室的用户 B,他平时网速极慢(分母极小)。即使他现在的瞬时速率依然很低,但由于被“饿”了很久,他的优先级比值会突然飙升!

比例公平算法完美地在“压榨全小区极限吞吐量”和“保障每个用户生存权”之间,找到了最精妙的平衡。


在这个没有红绿灯的十字路口,基站调度器以每毫秒千次的速度进行着这场复杂的运算。但是,只要资源块的总数是固定的,总有一天会面临分配殆尽的绝境。

为了突破这个平面的物理极限,工程师们不得不把目光投向了三维世界。既然地面已经被占满,我们为什么不在空中架起高架桥?

翻开下一页,我们将进入第八章:让空间也传递信息——MIMO 与波束赋形。看工程师如何强行撕开第四个维度。


第八章:让空间也传递信息——MIMO、分集与波束赋形

本章地图定位:第二层,多用户空口原理。前面七章,我们一直在时间轴、频率轴和码字轴上绞尽脑汁。但物理资源是有极限的。当频率切无可切,时间挤无可挤时,工程师们抬头看向了三维的天空,打开了近代通信史上最伟大的魔盒——空间维度。

1. 单天线的绝境

回顾一下我们之前探讨的突破香农极限的手段。提高网速无非两条路:增加带宽 $B$,或者提高信噪比 $S/N$。然而在现实中:

  • 买带宽太贵了,频谱是稀缺的战略资源。
  • 加大发射功率会迅速耗尽电池,并产生巨大的互调干扰。
  • 高阶调制(256QAM)对信道要求极其苛刻,信号稍弱就会降级。

到了 4G 研发的前夜,传统的“时间+频率”二维通信理论几乎已经被榨干到了极限。如果不引入全新的物理变量,网速提升将陷入停滞。

这时,研究者们提出了一个大胆的想法:既然单发单收(SISO,单天线发送、单天线接收)遇到了瓶颈,那我们为什么不在基站和手机上,各插上好几根天线
这就是 MIMO(多输入多输出,Multiple-Input Multiple-Output)

2. 空间分集(Diversity):不把鸡蛋放在一个篮子里

在使用 MIMO 提升网速之前,人们首先发现了多天线的另一个奇效:保命

在第四章我们讲过,由于多径效应,信号在某些位置会因为干涉而抵消,形成“深衰落点”。但这种衰落是高度局部化的。也许你的左手边完全没有信号,但右手边只要相隔半个波长,信号就可能非常好。

于是,工程师在基站上装了两根相隔一定距离的天线,发送完全相同的一份数据。只要两条路径中有一条没有发生毁灭性衰落,信号就能被成功接收。这就是空间分集(Spatial Diversity)。它不提高最高速度,但极大地提高了通信的可靠性

在 4G 的代码里,有一种极其优美的数学设计叫做 Alamouti 编码。它让两根天线在两个时刻交替发送经过共轭变换的数据,让接收端在完全不知道信道具体参数的情况下,仅凭简单的代数运算就能抵消干扰,获得满血的分集增益。

3. 空间复用(Multiplexing):平地起高架的奇迹

分集虽好,但它只是为了求稳。人类对网速的渴望是无穷的。如果我们让多根天线在同一个时间、同一个频率,发送完全不同的数据,能行吗?
这就是空间复用(Spatial Multiplexing),它直接在不增加任何带宽的前提下,成倍地提升了网速。

它怎么可能不干扰?这必须用到高等代数中的核心工具:信道矩阵(Channel Matrix)与线性方程组。

假设基站有 2 根发射天线,手机有 2 根接收天线。此时,空气不再是一个简单的衰减系数,而是一个矩阵 $\mathbf{H}$:
$$ \mathbf{y} = \mathbf{H} \mathbf{x} + \mathbf{n} $$
其中 $\mathbf{x}$ 是发送的信号向量,$\mathbf{y}$ 是接收的信号向量。虽然两路数据在空中撞在了一起,但由于两根接收天线所处的空间位置不同,它们收到的“混合比例”是不同的。

只要矩阵 $\mathbf{H}$ 是满秩的(多径环境越丰富,矩阵越容易满秩),手机芯片就可以通过解二元一次方程组(如强迫归零算法),把混合在一起的数据 A 和数据 B 完美地剥离出来!

空间复用是利用复杂的“多径环境”,在原本堵死的平原上强行架起了一层层“隐形高架桥”。 多径越多,MIMO 效果越好。如果是纯粹的真空环境,两条路径完全一样(线性相关),MIMO 反而会失效。

4. 5G 的绝对主力:Massive MIMO 与波束赋形

到了 5G 时代,工程师们彻底“疯狂”了。他们嫌 4 根天线太少,直接在基站面板上密密麻麻地贴上了 64 根甚至 128 根天线阵子。这就是 Massive MIMO(大规模天线阵列)

当拥有 64 根天线后,基站解锁了一个神级技能:波束赋形(Beamforming)

传统的基站像一个大灯泡,能量向四周无差别发散。而 Massive MIMO 基站像是由 64 名合唱队员组成的顶级乐团。通过精确控制每个天线振子发出的相位和幅度,它们会在特定方向上产生相长干涉,而在其他方向上相消干涉。

最终的结果是:基站发出的电磁波不再是发散的涟漪,而是合成了一束极窄、能量极度集中的**“能量探照灯(Beam)”**,精准地打在特定的手机上。

波束赋形带来了三项颠覆性优势:

  1. 信噪比暴增:能量不再散失,信号强度 $S$ 极大提升。
  2. 干扰归零:能量不往别处跑,背景噪声 $N$ 急剧下降。
  3. SDMA(空分多址):基站可以同时打出好几道波束,照在不同的人身上,让他们共享同样的频率和时间。

5. 第二层地图:破关总结

在这里,我们必须做一个深呼吸。

从第一章到第八章,我们把所有的精力都集中在了一个基站和几部手机之间的斗争上。我们为这辆数据战车配上了 QAM 引擎、LDPC 装甲,把它开上了 OFDMA 铺好的高架桥,并用波束赋形为它打上了高光。在第二层“空口原理”的视野里,我们已经做得足够完美了。

但是,只要你把视线再拉高,俯瞰整个世界。你会发现,一辆车不可能只在一个路口打转,它要在整个国家的路网上飞驰。

相邻的两个路口(基站)如果使用相同的频率,互相干扰了怎么办?当你坐在时速 350 公里的高铁上,手机如何能在每隔几秒就路过的新基站之间,完成毫无波澜的切换?这些数据最终流向了哪里的地下神经中枢?

我们将跨入全书最宏大、也最贴近社会体系的第三层。欢迎来到第三篇:蜂窝网络原理——城市的脉络


第九章:蜂窝的诞生——从大哥大到数字移动通信

本章地图定位:第三层,蜂窝网络原理。我们在前两篇搞定了“一辆车怎么跑得稳”和“一个十字路口怎么调度”。现在,我们终于要放眼全国,看看这座容纳了十亿级用户的“超级交通网”是如何拔地而起的。在这个宏大的系统工程里,我们将见证通信史上最伟大的几何学革命——蜂窝。

1. 大哥大的黄昏与无线电的诅咒

在上世纪 80 年代,如果你非常有钱,你可能会拥有一部极具身份象征的机器——摩托罗拉的大哥大。这就是传说中的 1G(第一代移动通信系统)。

当时的工程师们构建网络的方法非常简单粗暴,被称为**“大区制”**。他们会在城市的最高点(比如电视塔或最高的山峰上)建一个极其巨大的发射塔,用极其恐怖的发射功率向四周辐射电磁波。这样一个基站,就能覆盖方圆几十公里的整座城市。

这听起来很完美,只建一个基站就能覆盖全城,多省钱!但很快,大区制就迎来了它命中注定的死亡。

还记得第二章里的香农公式和频谱资源的稀缺性吗?一个国家能拿来做移动通信的频段(比如 900MHz 附近)是非常有限的。在 1G 的模拟系统里,一个语音通话大约需要 30kHz 的带宽。如果你总共只有 3MHz 的带宽,那你这个基站同时最多只能容纳 100 个人打电话

如果第 101 个人想打电话怎么办?对不起,频率用光了,系统忙音。在一个有着上百万人口的城市里,全城只能同时供 100 个人打电话!这就是为什么当年大哥大不仅机器贵,入网费更是天价。因为你买的不是机器,而是极其稀缺的无线频率使用权。

移动通信陷入了看似无解的死局:没有新的频率,就无法增加用户。

2. 贝尔实验室的神来之笔:蜂窝(Cellular)

如何打破这个死局?打破死局的不是某种新型的无线电硬件,而是一个极其巧妙的几何与管理学概念

美国贝尔实验室的天才工程师们(早在 1947 年就提出了概念,直到 70 年代才真正落地)提出了一项震惊世界的提案:不要再建覆盖几十公里的大基站了,我们建无数个只能覆盖几公里的小基站!

这听起来像是在倒退:为了覆盖同样的面积,我们要多花成百上千倍的钱去建基站?

但这正是蜂窝技术的灵魂所在——频率复用(Frequency Reuse)

假设我们只有 3 组频率(A、B、C)。在原来的大区制里,这 3 组频率覆盖了全城,总共只能容纳 300 人。现在,我们把城市切成一个个小的正六边形区域(因为正六边形最接近圆形,且能完美拼接不留缝隙,长得像蜜蜂的蜂巢,所以叫**“蜂窝”。每一个小区域叫做一个小区,Cell**)。

我们在相邻的几个小区里,分别使用 A、B、C 频率。重点来了:只要两个使用相同频率(比如 A)的小区,它们之间的物理距离相隔得足够远,它们发射的电磁波就不会互相干扰。

于是,在这座庞大的城市里,我们可以把 A、B、C 这三组频率,像铺地砖一样,无限次地重复使用。如果你在城市里建了 1000 个蜂窝小区,哪怕你总共只有 3 组频率,但由于频率被复用了 1000 次,你的系统总容量就从可怜的 300 人,瞬间暴涨到了 300,000 人!

蜂窝概念的本质,是用空间换频率,用成千上万个廉价的小基站,换取了无限的系统容量。 这也是为什么,我们现在用的移动通信网络,在英文里的正式学术名称永远都是 Cellular Network(蜂窝网络)

3. 同频干扰:六边形里的几何博弈

频率复用虽然创造了容量的奇迹,但它引来了一个最可怕的敌人——同频干扰(Co-channel Interference)

你在 A 频率的小区里打电话,远处的另一个 A 频率小区也在发信号。虽然你们隔了一段距离,但在空气中传播的电磁波是没有绝对边界的。那个远方基站的信号,依然会作为微弱的噪音传到你的手机里。

为了控制这种干扰,工程师们需要极其精密的网格规划。他们不能随便地乱用频率。2G 时代最经典的规划叫作 “7 小区复用模式”“3 小区复用模式”。也就是把所有的可用频率分成 7 份或 3 份,确保在地理位置上,任何两个使用相同频率的小区之间,至少隔着一两圈使用其他频率的小区作为“护城河”。

这绝对是一项极其痛苦的工作。早期的网络优化工程师(网优),每天的任务就是拿着测试手机满大街跑,看看哪里的同频干扰太严重了,然后爬上楼顶,调整基站天线的下倾角或发射功率,防止信号“溢出”到别的小区去。

4. 2G 的革命:把模拟变成数字

伴随着蜂窝理念的落地,人类通信史迎来了另一次极其重大的底层重构:从 1G 的模拟通信,跨越到 2G 的数字通信。

2G 彻底改变了这一切:

  1. 语音数字化:它强制把你的声音用声码器压缩成每秒几十 Kbps 的 0 和 1 比特流。
  2. 纠错编码:它给这些比特穿上了纠错码的防弹衣。
  3. 数字调制:它通过更加高效的调制技术把比特绑在载波上。
  4. 多址技术:它让多个人在同一个频率通道里排队说话(TDMA)。

数字化的 2G 带来了清晰无比的通话质量、加密防窃听的能力,以及一项极其偶然、却彻底改变人类社会的副产品——短信(SMS)。工程师最初只是想利用控制信道里多余的一点带宽让维护人员发一些系统指令。结果这个功能对大众开放后,迅速燃爆了全球。

2G 建立了一张极其庞大、极其完美的覆盖全球的语音蜂窝网络。但这张网,从一开始就不是为了让你“上网”而设计的。

当乔布斯在实验室里构思 iPhone 时,当人类想要在手机上浏览绚丽的网页和图片时,2G 狭窄的时隙和仅仅十几 Kbps 的网速,成为了禁锢移动互联网的铁笼。

为了打破这个铁笼,3G 时代伴随着一场血腥的标准大战,轰轰烈烈地到来了。让我们进入第十章:3G 的雄心与移动互联网前夜


第十章:3G 的雄心——CDMA、软切换与移动互联网前夜

本章地图定位:第三层,蜂窝网络原理。上一章我们用“频率复用”和六边形蜂窝,在城市里铺开了一张巨大的网。但在 2G 的网格里,每一个六边形都像是一个独立的孤岛。当你开着车跨越孤岛时,会发生什么?3G 是如何试图打破这些孤岛边界的?

1. 数据的渴望与 3G 的宏大愿景

2G(GSM)是一个为“语音”量身定制的完美系统。但人类的欲望总是膨胀的。当电脑上的互联网在 2000 年前后席卷全球时,通信巨头们产生了一个前瞻性的愿景:我们要把互联网塞进用户的口袋里。

3G(第三代移动通信)的诞生,就是为了实现“极速数据传输”和“视频通话”。为了实现这个目标,整个通信界爆发出了一场堪称惨烈的标准大战。

高通凭借在军方解密技术中发掘出的 CDMA(码分多址),死死地扼住了整个行业的咽喉。欧洲为了绕开高通的专利,搞出了 WCDMA;美国本土坚持 CDMA2000;而中国则推出了具有自主知识产权的 TD-SCDMA。虽然标准鼎立,但它们底层的逻辑是相通的:全面拥抱 CDMA

在第六章我们讲过,CDMA 的特点是“同频复用”。这意味着,在 3G 的蜂窝网络里,再也不需要像 2G 那样痛苦地去规划频率拨付了。全城所有的基站,全部使用一模一样的频率! 它们只靠不同的“扩频码”来区分彼此。

这种“同频组网”极大地提升了频谱利用率,但也引出了我们在第六章提到的魔鬼——“远近效应与同频干扰”。为了对抗干扰,3G 引入了神乎其技的极速功率控制。但这还不是 3G 最惊艳的改变。3G 带来的最强震撼,发生在你跨越小区边界的那一瞬间。

2. 跨越孤岛:切换(Handover)的生死时刻

想象一下,你正坐在时速 120 公里的汽车上通话。你的汽车正在飞速驶出“基站 A”的覆盖范围,驶入“基站 B”。在第一层链路看来,基站 A 发来的信号正在迅速衰减。如果不采取行动,两秒钟后电话就会断线。

为了保证通话不中断,网络必须执行一项极其危险的空中接力:切换(Handover)

在 2G 时代,切换被称为**“硬切换(Hard Handover)”。由于相邻基站频率不同,手机射频芯片必须进行频率跳转。硬切换的原则是“先断后连(Break before make)”**:

  1. 手机发现 A 信号不行了,向网络申请切换。
  2. 网络命令手机:“切断 A 连接,立即调谐到 B 频率!”
  3. 手机咔嚓一下断开 A,然后在零点几秒的盲区里,拼命去锁定 B 的信号。

这就像在悬崖间荡秋千,你必须先松开手里的藤蔓,在半空中飞跃,再去抓另一根。只要网络稍微卡顿,你就会摔下悬崖——这就是 2G 时代坐在车上打电话经常掉线的根本原因。

3. 3G 的魔法:软切换(Soft Handover)

3G(CDMA)的出现改变了这种提心吊胆的秋千游戏。由于全网同频,手机天线可以同时接收到 A 和 B 发来的电磁波,不需要进行频率跳转。

高通的工程师们发明了移动通信史上最温柔的一刀:软切换(Soft Handover)。它的原则是**“先连后断(Make before break)”**。

当你的汽车驶入 A 和 B 的交界处时:

  1. 你的手机同时听到了基站 A 和基站 B 的声音。
  2. RAKE 接收机 此时立下了汗马功劳。它把 A 和 B 当作两个不同的多径源,用不同的“手指”分别抓住信号,并在芯片内部将它们在时间上对齐并叠加
  3. 奇迹发生了:在小区交界处(原本信号最差的地方),由于软切换的合并机制,信号强度反而得到了极大增强!这种增益被称为“宏分集增益”。
  4. 当你彻底进入 B 的腹地,A 信号彻底消失时,手机才恋恋不舍地松开基站 A 的手。

在软切换中,你不是在悬崖间飞跃,而是两只脚分别踩在两艘并排行驶的船上,直到完全跨过去。

4. 生不逢时的过渡者

3G 拥有完美的软切换,拥有强大的 CDMA 数学内核,它甚至在演进版本(HSPA+)中把网速拉到了 42Mbps。但 3G 更像是一个略显悲情的过渡者。

它野心勃勃地想要开启移动互联网时代,但在它商用的最初几年,市场上根本没有足以支撑庞大数据消费的智能手机,杀手级应用也无影无踪。

更致命的是,3G 的核心网架构依然保留着浓厚的语音交换机影子。它骨子里还是一个以打电话为主、顺便上上网的网络。当 2007 年 iPhone 发布彻底引爆数据海啸时,3G 复杂的 CDMA 物理层(不堪重负的功率控制)和老旧的核心网,在暴涨的流量面前迅速被压垮了。

移动互联网的真正引爆器,必须是一场彻头彻尾的革命。我们需要把复杂的 CDMA 扔进历史,换上简单暴力的 OFDMA;我们需要把地下的语音交换机彻底砸烂,换成全 IP 的路由。

这就是 4G 即将掀起的血雨腥风。让我们进入第十一章:4G 的真正革命——LTE 与全 IP 网络


第十一章:4G 的真正革命——LTE 与全 IP 网络

本章地图定位:第三层,蜂窝网络原理。在天上,4G 用 OFDMA 和 MIMO 击碎了 3G 的 CDMA。但这只是它一半的功劳。本章我们将潜入地下,去看看 4G 是如何在“核心网”层面发动了一场流血的革命,彻底埋葬了统治通信行业一百年的老国王——“电路交换”。

1. 隐藏在地下室里的老国王:电路交换(CS)

从第一章到第十章,我们所有的目光都聚焦在天空中飞行的电磁波上。这部分被统称为无线接入网(RAN)。但基站只负责把你手机发出的电磁波抓下来,变成光缆里的比特。这些比特要去哪里?它们怎么找到地球另一端你正在通话的那个人?这需要靠地下一套极其庞大的中枢神经系统——核心网(Core Network)

在 1G 到 3G 的时代,核心网的最高统治者是电路交换(CS,Circuit Switched)。这套体制的祖宗可以追溯到一百多年前接线员小姐的时代。

什么是电路交换?当你拨通电话,网络会为你和对方打通一条端到端的、极其排他的物理或逻辑电路。只要不挂电话,哪怕你们互相沉默听对方呼吸,这条电路也一直被死死霸占。

这种体制对于“语音通话”是完美的,但对于互联网数据则是场灾难。因为互联网数据是**“突发性”**的。你打开网页,唰的一下数据传完了,接下来的几分钟你都在阅读。如果用电路交换,这几分钟里你依然霸占着专线,这是对资源的极大浪费。

2. 互联网的刺客:分组交换(PS)

与电路交换相对立的是互联网的底层逻辑:分组交换(PS,Packet Switched)

分组交换就像邮政系统。你要发的一张高清照片会被切成无数个几千字节的“数据包”。每一个包都贴上了写着收件人 IP 地址的快递单,然后扔进网络。路由器看一眼快递单,把包踢向下一个节点。这些包可能走不同的路,最后在目的地重组。

这种体制对于突发数据极其高效,谁有数据谁就发。但它也有缺点:尽力而为(Best Effort)。它不保证按时送达,如果路口堵车,你的视频就会转圈。

3. 3G 时代的妥协与精神分裂

当 3G 试图把互联网塞进口袋时,它面对的是尴尬的局面:一方面人们需要打电话(CS),另一方面需要上网(PS)。

于是 3G 的核心网变成了臃肿的怪物:一半是庞大昂贵的语音交换机(MSC),另一半是专门建的路由器集群(SGSN/GGSN)。维护这样一张“双轨制”网络成本高昂且效率低下。

4. 4G 的暗杀令:LTE 与全 IP 网络

2004 年,面对 WiMAX 的咄咄逼人,通信界启动了 LTE(长期演进) 计划。4G 革命不仅仅是把 CDMA 换成了 OFDMA,它在核心网层面下达了最冷酷的暗杀令:彻底绞杀电路交换!

4G 推出了一套全新的核心网架构:EPC(演进型分组核心网)。在这个核心网里,找不到任何一台专门用来打电话的语音交换机。整个核心网被推平,变成了全 IP(All-IP)网络。所有的数据,不管你是语音、图片还是视频,全部统统打包成 IP 数据包。移动通信网络终于在底层与互联网(TCP/IP)完成了史诗级会师。

5. 打电话怎么办?VoLTE 的诞生

既然语音交换机被炸毁了,4G 手机还能打电话吗?

在 4G 商用初期,出现过一种尴尬:当你正打着游戏,突然一个电话打进来,手机瞬间掉回 2G 信号,游戏掉线。这就是 CSFB(电路域回落),因为 4G 初期不支持打电话,必须借用老旧的 2G 网络。

于是,VoLTE(Voice over LTE) 诞生了。VoLTE 的本质是把语音也强行切碎,伪装成上网的数据包。为了防止语音包在复杂的互联网里“堵车”,4G 核心网建立了一套强悍的 QoS(服务质量)保障机制。当网络识别出这是语音包时,会一路亮绿灯,甚至强行挤开看视频的数据流,保证语音包在几十毫秒内绝对准时到达。通过 VoLTE,语音终于沦为了一种高级的“应用程序”。

6. 基站的独立宣言:X2 接口与极速切换

除了全 IP 化,4G 还做了一件大事:网络扁平化

在 2G/3G 时代,基站是“傻”的提线木偶,所有决策都要层层上报。到了 4G,基站(eNodeB)变成了拥有高度自主权的智能节点。更绝的是,4G 为基站之间修了一条名为 X2 接口 的秘密通道。

这彻底改变了“切换”机制。由于 4G 使用 OFDMA,3G 那种两只脚踩两只船的“软切换”在物理层变得代价极高。于是 4G 退回了硬切换(先断后连)。但这是极速协同的硬切换:

  1. A 基站发现你要跑了,直接通过 X2 接口告诉 B:“客户马上到,数据和资源准备好!”
  2. B 回复:“收到,已就绪!”
  3. 手机切断 A 瞬间连上 B,整个过程被压缩到几十毫秒内。

通过 X2 接口,4G 用廉价的硬件实现了超越 3G 软切换的无缝体验。

7. 第三层地图:破关总结

至此,我们的**第三篇:蜂窝网络原理(城市的脉络)**宣告结束。

  1. 蜂窝的诞生,用空间复用打破了频率稀缺的紧箍咒。
  2. 3G 的尝试,用软切换模糊了六边形的边界。
  3. 4G 的革命,用全 IP 化彻底清洗了百年历史的电路交换。

现在,4G 已经足够完美。那么,为什么全人类还要耗费万亿资金去发起一场名为“5G”的豪赌?5G 到底新在哪里?它真的只是为了让你下载电影更快吗?

我们将登上整个系统工程的巅峰:第四篇:系统工程的巅峰——5G 与未来


第十二章:5G 到底新在哪里

本章地图定位:第四层,系统工程的巅峰。现在,我们已经手握前三层所有的武器。当我们带着香农极限、OFDMA、Massive MIMO 和全 IP 核心网来到 5G 时代时,你会发现,5G 不再是单一物理层技术的突进,而是一场涵盖了人、机器和社会的超级系统重构。

1. 被神话与被误解的 5G

如果评选通信史上被大众营销神话得最厉害、同时也背负了最多误解的一代技术,那绝对非 5G 莫属。在 5G 商用的前夜,铺天盖地的宣传让我们相信:5G 会让下载高清电影只需要一秒钟,会让所有的汽车自动驾驶,会让外科医生跨国远程手术。

但几年过去,很多消费者的感受却是:网速似乎没有飞跃,手机反而更费电了。5G 到底是怎么回事?它真的失败了吗?

要回答这个问题,你必须跳出“个人消费者”的视角。

在过去的四十年里(1G 到 4G),移动通信服务的对象只有一种:。所有的技术演进,都是为了让人能更快地打语音、刷网页、看视频。但地球上只有 80 亿人,且人类肉眼的极限是固定的。当你能在手机上流畅播放 4K 视频时,再把网速提高 10 倍,你作为碳基生物的肉眼也分辨不出来。

所以,5G 的野心不在“人”身上。它的服务对象,从人,变成了**“万物”**。

2. 国际电联的终极考卷:5G 的三大场景

国际电信联盟(ITU)定义了 5G 必须征服的三大场景:

1. eMBB(增强型移动宽带)—— 跑得极快的超级跑车
这是 4G 的直接延续。目标是极限速率达到 10Gbps 甚至 20Gbps。这是为了满足未来的 8K 视频、VR(虚拟现实)和 AR(增强现实)的需求。Massive MIMO 和毫米波技术主要就是为此而生。

2. uRLLC(超高可靠低时延通信)—— 绝对不能出错的防弹车
这是 5G 真正质变的场景。它要求延迟低至 1 毫秒,且可靠性达到 99.999%。这是给机器用的。自动驾驶汽车通过网络协调刹车,如果延迟几十毫秒,车早就撞碎了。uRLLC 是 5G 进军工业互联网的绝对杀手锏。还记得第五章里的 Polar 码 吗?它就在这种极短且关键的通信中展现了数学统治力。

3. mMTC(海量机器类通信)—— 极其廉价的公交大巴
这个场景要求在一平方公里的范围内,能同时接入 100 万个设备!这是给水表、电表、路灯、共享单车用的。这些设备数据量微小,但数量庞大且要求电池能用十年不换。

3. 精神分裂的网络:怎么可能同时满足?

如果你仔细审视,你会发现这三大场景在工程物理上是严重互斥的

  • eMBB 要求极宽的马路(大带宽),非常耗电。
  • uRLLC 要求极短的传输时延,防弹衣(纠错码)必须套得极厚。
  • mMTC 要求极简的协议,为了省电连同步过程都省了。

在现实中,你不可能要求一条马路既能让 F1 赛车以 300 码飙车(eMBB),又能让防弹运钞车绝对安全地慢行(uRLLC),同时还能容纳 100 万辆自行车(mMTC)。

这就是 5G 真正的挑战。面对这份“不可能”的考卷,通信巨头交出的答卷是:网络切片(Network Slicing)

4. 5G 皇冠上的明珠:网络切片

既然物理马路无法同时满足要求,那我们就用软件定义的方法把它“切”开。

在 4G 时代,基站和核心网大多是功能固定的专用硬件。到了 5G 时代,核心网发生了“IT 化”革命。所有的专用设备都被扔掉了,取而代之的是标准服务器集群。原本固化在硬件里的协议,全部变成了可以随时安装卸载的软件代码(NFV,网络功能虚拟化)

有了虚拟化,5G 可以针对同一套物理基站和频率资源,在空中和地下切割出三张独立的、互不干扰的虚拟网络(切片)

  1. 视频切片:分配极大带宽,并启用边缘计算(MEC),让你看视频零缓冲。
  2. 自动驾驶切片:这是一条绝对优先的“专用道”,任何其他数据不准占用,数据直接插队发送。
  3. 物联网切片:这是一片极其庞大的慢车道,协议精简到极致。

这才是 5G 真正“新”的地方。它不再是一张仅仅为了手机刷短视频而存在的网。它是一张可以随着社会需求,像变形金刚一样随意重组架构的基础设施网。

这也就解释了为什么普通消费者对 5G 感知不强:因为 5G 那头极其恐怖的系统怪兽,它的尖牙和利爪,是伸向工厂、矿山、无人码头和自动驾驶汽车的。 当 5G 在企业级市场的潜能彻底激发时,它将改变的是整个社会的生产方式。

但在工程师眼里,5G 虽然庞大,却依然没有摆脱 1948 年那个古老公式的阴影。随着 5G 的落地,人类的目光不可避免地投向了地平线之外。6G 究竟该向何处去?

我们将进入第十三章:极限之后——6G 与通信的未来


第十三章:极限之后——6G、智能网络与通信的未来

本章地图定位:从第一层到第四层,在图纸的尽头。当 5G 的商用已经铺开时,在实验室里,最顶尖的通信科学家们正对着 1948 年的那张旧图纸陷入沉思。香农公式这座大山,我们真的快要爬到顶了。那在极限之后,6G 的未来究竟在哪里?

1. 被压榨到极致的香农极限

让我们在这本书的尾声,最后一次直视那个冰冷且伟大的香农公式:
$$ C = B \log_2(1 + \frac{S}{N}) $$

从 1G 到 5G,无论多么花哨的缩写(CDMA, OFDM, MIMO, QAM),本质上都只是在这个公式周围打转。

  • 我们用极度复杂的 LDPC 码和 Polar 码,把纠错能力逼近了理论极限。
  • 我们用 Massive MIMO 和极其精确的波束赋形,在空间环境里把信噪比 $S/N$ 榨干到了极致。

通信界有一种强烈的共识:在现有的电磁波理论框架内,物理层面的传输效率已经很难再有指数级的突破了。我们就像是在一块已经被拧得极干的海绵里,试图再挤出一滴水。那 6G 该怎么打?如果想让网速再翻 10 倍甚至 100 倍(达到 Tbps 级别),我们还能动哪个变量?

只剩下一个最粗暴的变量:带宽 $B$

2. 向更高的频率攀登:太赫兹(THz)的陷阱

既然要极宽的带宽,我们只能向无线电频谱的最高峰攀登。在 6G 的蓝图里,科学家们瞄准了一个曾经的“死亡禁区”:太赫兹(Terahertz, 1 THz = 1000 GHz)

在太赫兹频段,大片大片的频谱是完全空白的。你可以极其奢侈地划出几十个 GHz 的连续带宽!但为什么以前不用?

频率 $f$ 极高,波长 $\lambda$ 就极短。太赫兹的波长不到 1 毫米。这么短的波长,导致了极其恐怖的物理灾难:

  1. 穿透力几乎为零:一张白纸甚至空气中的水分子,都能把太赫兹电磁波彻底吸收。
  2. 极大的路径损耗:太赫兹波在空气中传播衰减极快。自由空间路径损耗(FSPL)公式告诉我们:
    $$ \text{FSPL} = \left( \frac{4\pi d f}{c} \right)^2 $$
    由于频率 $f$ 被平方放大了,信号稍微飞出十几米远,能量就会衰减到无法探测。

面对这个困境,工程师们提出了一个极其科幻的想法。既然空气环境这么糟糕,我们为什么不**“改造环境”**?

3. 改造环境:智能超表面(RIS)

在 1G 到 5G 的漫长岁月里,我们只能被动地去“对抗”环境。但在 6G 愿景中,智能超表面(RIS) 技术横空出世。

RIS 就像一张极其轻薄的壁纸,贴在大楼外墙或玻璃上。这张纸上刻着成千上万个可以通过电压控制的“电磁波反射单元”。当基站发出的电磁波打到这面墙上时,它不再遵循自然规律发生散射。基站可以通过网络下达指令,让墙面瞬间改变物理特性。

结果是:这面墙像一面可以随意扭曲的“魔镜”一样,把电磁波极其精准地汇聚、拐弯,直接反射进本来毫无信号的死角。 我们把城市本身变成了通信网络的一部分,解决了太赫兹波传不远、绕不过去的问题。

4. 打破二维:天地一体化网络

马斯克的星链给出了 6G 的另一个演进方向:非地面网络(NTN)

传统的基站全是建在地上的,地球 70% 的海洋和广袤的无人区是永远的信号盲区。6G 将彻底打破这种限制,它将数万颗低轨道卫星(LEO)与地面基站深度融合成一张**“天地一体化的 3D 巨网”**。

这不仅是把基站搬到天上去。它要求手机在接收地面信号时,还能随时无缝切换到头顶 500 公里外以第一宇宙速度狂奔的卫星信号。面对卫星高速移动带来的恐怖多普勒频移,6G 的物理层必须经过极其惨烈的重新设计。一旦建成,移动网络将如同空气一般遍布全球,无处不在。

5. 灵魂注入:AI 原生(AI-Native)物理层

如果有一天,我们不再依赖人类数学家写下的傅里叶变换公式呢?

AI 原生物理层的激进想法是:把传统的发射机和接收机彻底推翻,换成深度学习神经网络。

  • 发射端的 AI 不管什么星座图,它自己学习“如何编码才能在恶劣空气中活下来”。
  • 接收端的 AI 不管什么译码公式,它只负责在一锅乱粥里,凭着海量训练经验,一眼看穿发射端想说的是 0 还是 1。

如果这个想法成真,那将是对传统通信原理的一次彻底“降维打击”。香农公式依然是真理,但我们逼近真理的手段,将从“严密的数学推导”变成“大模型的暴力美学”。


6G 的画卷才刚刚展开。太赫兹、RIS、天地一体化卫星网、AI 原生物理层……这些科幻技术正在实验室里淬炼。

但无论未来的技术如何天花乱坠,请永远记住我们在第一章画下的那张“三层地图”。万变不离其宗。6G 依然是在解决“单车性能”、“路口调度”和“城市路网规划”这三个根本问题。

现在,合上这本写满未来狂想的图纸。我们将进入最后一章,去回顾这段跨越百年的旅程。

翻开下一页,欢迎来到终章:重新理解移动通信


终章:重新理解移动通信

本章地图定位:三万英尺的高空之上。合上这本《重新理解移动通信》,我们要降落了。

飞机开始缓缓下降。空乘人员通过广播提醒乘客系好安全带,并收起小桌板。窗外的云层被渐渐穿透,一座庞大的现代化城市如同极其精密的集成电路板一样,在机翼下方徐徐展开。

几分钟后,飞机平稳地降落在跑道上。随着机舱内响起“可以开启手机网络”的提示音,一瞬间,这架飞机上的两百多部手机,几乎在同一时刻解除了“飞行模式”。

在普通人的视角里,这只是一个极其日常的动作。手指轻轻一拨,几秒钟后,屏幕右上角的“无服务”变成了“5G”。微信提醒此起彼伏,短视频的未读消息亮起。但在你我——读完了前面十三章的人——的视角里,这短短的两秒钟,是一场壮丽的**“电磁波史诗战役”**。

1. 视界的重构:看不见的战争

当你闭上眼睛,你仿佛能“看”到这场战役是如何爆发的:

在这架飞机的金属蒙皮外围,附近机场的基站像嗅到猎物的超级交警,瞬间捕捉到了这两百多部手机发出的微弱同步请求。由于距离和遮挡,这些信号被**“多径衰落”**狠狠地扭曲了。但基站芯片瞬间开启了 OFDMA,用成千上万个带 循环前缀(CP) 的子载波,将破碎的回声硬生生地拉直。为了保证信息不被噪声($N$)淹没,手机芯片早已为比特穿上了 LDPC 码和 Polar 码的数字防弹衣。

与此同时,基站顶部的 Massive MIMO 天线阵列开始疯狂计算信道矩阵。它的 64 根天线如同顶级合唱团,在极短的毫秒内,在空中合成了一道锐利的电磁波“探照灯(波束赋形)”,精准地打在你的手机上。

你刚打开一个 4K 视频流,基站发现你的路况极好,挂上了 256QAM 的最高档位。这一切空中魔法被基站接收后,瞬间转化为地下光缆里的光信号。全 IP 化的核心网路由器直接将这些数据包通过光纤踢向服务器。而在你走向航站楼的过程中,基站之间通过 X2 接口的疯狂交流,让你在几十毫秒的极速切换中,连一帧视频都没有卡顿。

这一切极其精密、极度暴力的物理与数学运算,全部发生在你手指拨下“关闭飞行模式”的那一瞬间。

2. 工程的伟大与香农的微笑

在这本书的开头,我曾说自己是一个被技术浪潮甩开的跨界者。但在回顾这段旅程时,我深深感受到:移动通信是一门极其“笨重”且硬核的学科。

软件工程师写错代码可以发补丁。但通信工程师如果算错了一个多径延迟时间,如果搞错了频率复用的几何距离,他们要面对的是在全国几十万座大山、戈壁和楼顶拧天线螺丝的恐怖噩梦。

所以,这是一群对自然规律保持着绝对敬畏的人。他们不相信永动机,他们知道网速极限永远被卡在 1948 年克劳德·香农写在纸上的那个冷酷公式里:
$$ C = B \log_2\left(1 + \frac{S}{N}\right) $$

但恰恰是对极限的敬畏,逼出了人类历史上最令人惊叹的工程智慧。为了在香农的笼子里多挤出一点容量,人类的数学家发明了正交空间、信道极化以及利用多径环境增加维度的 MIMO 魔法。

从 1G 时代那些手拿大哥大的暴发户,到今天在地铁里刷短视频的普通打工人。三十年间,移动通信从一个服务少数精英的奢侈品,演变成了一个像水、电、空气一样,普通人根本不会感知其存在,但一旦失去半小时就会陷入社会恐慌的**“终极基础设施”**。

3. 重新理解移动通信

那么,我们到底在重新理解什么?

我们重新理解了它的本质。 它不是魔法,而是一场人类利用微积分、概率论、线性代数和微波物理,在空气这种极其恶劣的介质中,与噪声、干扰、距离和时间进行的百年战争。

我们重新理解了它的结构。 无论技术名词多么繁杂,只要你脑海中带着那张“三层地图”(无线链路、多用户空口、蜂窝网络),用那个“交通系统”的隐喻去拆解,所有的 5G、6G 技术都会乖乖地落入它们该去的坐标位置。

最后,我们重新理解了人类文明的前进方式。 很多人觉得文明的灯塔是站在聚光灯下发布手机的狂人。但在看完这本书后,希望你在下一次抬头看到远方楼顶长满天线的基站时,能在心里生出一丝敬意。

正是那些在幕后与衰落、噪声死磕了一辈子的工程师们,用无数冰冷的数学公式,硬生生地在这颗星球的空气中,为全人类织出了一张看不见的信息神经网。他们没有改变人类的肉体,但他们彻底进化了人类连接世界的方式。

飞机停稳了。城市真实的喧嚣扑面而来。带上这本书交给你的地图,去尽情享受这个虽然充满噪声,但永远能够被天才们用纠错码还原的、极其真实且美好的数字世界吧。

(全书完)