AI数据中心为什么会出现LPO、NPO、CPO和XPO?
随着AI大模型训练进入万卡、十万卡时代,数据中心交换机的带宽快速提升,从12.8T、25.6T发展到51.2T、102.4T,未来甚至将迈向204.8T。
交换芯片每秒需要处理上百Tbps的数据,而真正的瓶颈已经不再是交换能力,而是高速电信号如何传输。
电互连正在成为瓶颈,交换芯片输出的是高速并行电信号。
芯片内部通过SerDes(Serializer/Deserializer,串并转换器),将并行数据转换为112G/224G PAM4等高速串行电信号,再通过PCB走线传输到光模块,最终转换成光信号。
随着速率不断提升,高速电信号在PCB上传输几十厘米便会产生:
插入损耗
串扰与反射
更高的误码率
更大的DSP补偿开销
传统光模块内部通常配置DSP,对损伤信号进行均衡、时钟恢复和纠错。但DSP本身却成为光模块最大的功耗来源。
因此,整个行业开始思考两个问题:
能否缩短电信号传输距离?
能否直接取消DSP?
于是便产生了今天几条主要技术路线,其实它们描述的是不同层面的技术。
LPO:描述的是电气架构(是否采用DSP)
NPO、CPO:描述的是光引擎与ASIC的封装位置
XPO:描述的是新一代可插拔接口和模块生态
因此它们之间并不是完全互斥的关系。
LPO:取消DSP,让SerDes承担更多工作
**LPO(Linear Pluggable Optics)**仍然保持传统可插拔光模块形态,但取消(或大幅简化)模块内部DSP。
整个链路变成:
ASIC SerDes → 光模块 → 光纤
DSP原本负责的部分均衡能力交由交换芯片SerDes承担,因此LPO具有:
功耗更低
时延更低
成本更低
保留可插拔、易维护优势
但与此同时,对整个系统提出了更高要求:
更强的SerDes均衡能力
更好的PCB设计
更严格的链路预算
更高的器件线性度
因此,LPO本质上是**"用更强的ASIC换掉DSP"**。
NPO:把光模块搬到交换芯片旁边
**NPO(Near-Packaged Optics)**并没有取消光模块,而是把光引擎从交换机前面板移动到交换芯片附近。
核心思想十分直接:
缩短高速电信号在PCB上的传输距离。
这样可以显著降低:
插入损耗
信号完整性压力
DSP补偿压力
系统功耗
NPO可以理解为传统可插拔光模块与CPO之间的折中方案。
CPO:把光引擎直接放进交换芯片封装
如果继续沿着"NPO"的思路发展,最终就得到CPO(Co-Packaged Optics)。
CPO直接将光引擎与交换ASIC放在同一封装内。
这样,高速电信号仅需传播几毫米便立即转换成光信号。
优势十分明显:
最短电互连
最低损耗
最低功耗
最大带宽密度
但代价同样巨大:
封装复杂
散热困难
光模块无法独立更换
维护成本最高
因此,CPO代表的是功耗和带宽密度的极致路线。
XPO:面向AI的新一代可插拔光模块
**XPO(eXtra-dense Pluggable Optics)**则走了另一条路线。
它不是继续向CPO靠拢,而是在保留可插拔生态的基础上,提高模块密度。
XPO主要特点包括:
超高带宽密度
更多高速通道(如64 Lane)
面向液冷设计
支持单模块数Tbps以上互连
保持可维护、可更换
因此:
XPO解决的是"可插拔还能继续扩展吗"的问题。
需要注意的是:
XPO与LPO并不冲突。
XPO描述的是模块规格,而LPO描述的是模块内部是否采用线性架构,因此完全可以出现:
Linear XPO
SerDes与DSP:谁负责修复信号?
很多人会混淆SerDes和DSP。
实际上:
SerDes负责产生高速电信号,同时具备一定均衡、链路训练和时钟恢复能力。
它能够补偿:
短距离PCB
封装
连接器
带来的信号损伤。
而DSP则是更强大的信号处理器,用于修复:
更长距离PCB
更复杂信道
更严重信号失真
因此:
SerDes负责"轻度修复",DSP负责"重度修复"。
LPO正是利用不断增强的SerDes能力,逐渐替代传统DSP。
TP2是什么?
TP2(Test Point 2)是光模块测试中的标准测试点,通常位于:
光模块发射端的光输出接口。
这里会测试:
光眼图
发射功率
OMA
TDECQ
消光比等指标
它是评价光模块发射性能的重要测试接口。
总结
LPO、NPO、CPO和XPO,并不是几种相互竞争的光模块,而是AI数据中心向更高带宽、更低功耗演进过程中,从不同维度提出的解决方案:
LPO:减少DSP,降低功耗。
NPO:缩短电互连,降低损耗。
CPO:光电共封装,实现极致性能。
XPO:保持可插拔生态,提升带宽密度。
它们共同体现了数据中心网络的发展趋势:
从"电互连主导"逐步迈向"光互连主导"。
未来AI集群中,高速电信号将只在交换芯片封装内部传播几毫米,而长距离传输将越来越早地转换为光信号完成。这也是未来高性能网络演进的核心方向。