AI数据中心为什么会出现LPO、NPO、CPO和XPO?

随着AI大模型训练进入万卡、十万卡时代,数据中心交换机的带宽快速提升,从12.8T、25.6T发展到51.2T、102.4T,未来甚至将迈向204.8T。

交换芯片每秒需要处理上百Tbps的数据,而真正的瓶颈已经不再是交换能力,而是高速电信号如何传输。

电互连正在成为瓶颈,交换芯片输出的是高速并行电信号。

芯片内部通过SerDes(Serializer/Deserializer,串并转换器),将并行数据转换为112G/224G PAM4等高速串行电信号,再通过PCB走线传输到光模块,最终转换成光信号。

随着速率不断提升,高速电信号在PCB上传输几十厘米便会产生:

插入损耗
串扰与反射
更高的误码率
更大的DSP补偿开销

传统光模块内部通常配置DSP,对损伤信号进行均衡、时钟恢复和纠错。但DSP本身却成为光模块最大的功耗来源。

因此,整个行业开始思考两个问题:

能否缩短电信号传输距离?
能否直接取消DSP?

于是便产生了今天几条主要技术路线,其实它们描述的是不同层面的技术。

LPO:描述的是电气架构(是否采用DSP)
NPO、CPO:描述的是光引擎与ASIC的封装位置
XPO:描述的是新一代可插拔接口和模块生态

因此它们之间并不是完全互斥的关系。

LPO:取消DSP,让SerDes承担更多工作

**LPO(Linear Pluggable Optics)**仍然保持传统可插拔光模块形态,但取消(或大幅简化)模块内部DSP。

整个链路变成:

ASIC SerDes → 光模块 → 光纤

DSP原本负责的部分均衡能力交由交换芯片SerDes承担,因此LPO具有:

功耗更低
时延更低
成本更低
保留可插拔、易维护优势

但与此同时,对整个系统提出了更高要求:

更强的SerDes均衡能力
更好的PCB设计
更严格的链路预算
更高的器件线性度

因此,LPO本质上是**"用更强的ASIC换掉DSP"**。

NPO:把光模块搬到交换芯片旁边

**NPO(Near-Packaged Optics)**并没有取消光模块,而是把光引擎从交换机前面板移动到交换芯片附近。

核心思想十分直接:

缩短高速电信号在PCB上的传输距离。

这样可以显著降低:

插入损耗
信号完整性压力
DSP补偿压力
系统功耗

NPO可以理解为传统可插拔光模块与CPO之间的折中方案。

CPO:把光引擎直接放进交换芯片封装

如果继续沿着"NPO"的思路发展,最终就得到CPO(Co-Packaged Optics)。

CPO直接将光引擎与交换ASIC放在同一封装内。

这样,高速电信号仅需传播几毫米便立即转换成光信号。

优势十分明显:

最短电互连
最低损耗
最低功耗
最大带宽密度

但代价同样巨大:

封装复杂
散热困难
光模块无法独立更换
维护成本最高

因此,CPO代表的是功耗和带宽密度的极致路线。

XPO:面向AI的新一代可插拔光模块

**XPO(eXtra-dense Pluggable Optics)**则走了另一条路线。

它不是继续向CPO靠拢,而是在保留可插拔生态的基础上,提高模块密度。

XPO主要特点包括:

超高带宽密度
更多高速通道(如64 Lane)
面向液冷设计
支持单模块数Tbps以上互连
保持可维护、可更换

因此:

XPO解决的是"可插拔还能继续扩展吗"的问题。

需要注意的是:

XPO与LPO并不冲突。

XPO描述的是模块规格,而LPO描述的是模块内部是否采用线性架构,因此完全可以出现:

Linear XPO

SerDes与DSP:谁负责修复信号?

很多人会混淆SerDes和DSP。

实际上:

SerDes负责产生高速电信号,同时具备一定均衡、链路训练和时钟恢复能力。

它能够补偿:

短距离PCB
封装
连接器

带来的信号损伤。

而DSP则是更强大的信号处理器,用于修复:

更长距离PCB
更复杂信道
更严重信号失真

因此:

SerDes负责"轻度修复",DSP负责"重度修复"。

LPO正是利用不断增强的SerDes能力,逐渐替代传统DSP。

TP2是什么?

TP2(Test Point 2)是光模块测试中的标准测试点,通常位于:

光模块发射端的光输出接口。

这里会测试:

光眼图
发射功率
OMA
TDECQ
消光比等指标

它是评价光模块发射性能的重要测试接口。

总结

LPO、NPO、CPO和XPO,并不是几种相互竞争的光模块,而是AI数据中心向更高带宽、更低功耗演进过程中,从不同维度提出的解决方案:

LPO:减少DSP,降低功耗。
NPO:缩短电互连,降低损耗。
CPO:光电共封装,实现极致性能。
XPO:保持可插拔生态,提升带宽密度。

它们共同体现了数据中心网络的发展趋势:

从"电互连主导"逐步迈向"光互连主导"。

未来AI集群中,高速电信号将只在交换芯片封装内部传播几毫米,而长距离传输将越来越早地转换为光信号完成。这也是未来高性能网络演进的核心方向。