光网络需要的,究竟是垂域大模型,还是垂域智能系统?

自大模型技术兴起以来,光网络领域一直存在一个争议。

一种观点认为,光网络专业性强、知识复杂,通用大模型难以高效解决故障诊断、性能优化等垂域任务,因此必须构建专门的光网络垂域大模型。

另一种观点则认为,当前通用大模型已经具备较强的理解和推理能力,只需要通过RAG接入光网络知识即可。盲目微调甚至重新训练垂域模型,反而可能破坏原有的通用推理能力。

但问题的关键并不在于选择“RAG还是微调”,而在于先判断:模型缺的究竟是知识、方法,还是能力

一、光网络需要垂域能力,但未必需要重训一颗垂域大模型

光网络确实具有较高的专业门槛。其任务通常涉及复杂拓扑、时序告警、物理性能、设备配置和操作约束,通用模型仅凭已有参数知识,很难稳定完成实际任务。

但这并不意味着必须从头训练一颗独立的光网络大模型。

更现实的技术路线是:

强通用模型底座 + 光网络知识系统 + 专业工具与工作流 + 必要的轻量微调。

其中,RAG和微调解决的是不同问题:

例如,设备手册、标准规范、历史问题单和实时网络状态适合通过RAG动态获取;根因定位流程、优化策略排序和安全操作规范,则更适合通过skill规范流程或者通过专家样本轨迹进行轻量微调。

因此,RAG和微调并不是相互替代的两条路线,而是垂域智能系统中的不同组成部分。

二、光网络真正需要的可能不是一颗模型,而是一套系统

一个可靠的光网络智能系统,至少应当包括五个层次。

1. 通用推理底座

选择推理、代码生成和工具调用能力较强的通用模型,充分继承其通用知识和逻辑推理能力,不轻易重新训练底座。

2. 领域知识层

通过文档RAG、问题单知识库、知识图谱、拓扑数据库、设备资产库和实时状态数据,为模型提供准确、可更新、可追溯的专业知识。

3. 领域表示层

将光网络中的图结构、时序事件和物理量,转换为模型能够稳定理解的结构化表示,例如拓扑子图、告警时间线、功率传播链和设备层级关系。

这一层往往比是否微调更加重要。再强的模型,如果输入仍然是冗长、含糊的自然语言拓扑,也很难完成稳定推理。

4. Skill与工具层

模型不应仅凭语言预测性能结果,而应调用专业工具完成拓扑查询、光性能仿真、日志解析、功率读取、策略验证和设备操作。

大模型负责理解意图、规划步骤和组织结果,确定性工具负责计算、执行与校验。

5. 轻量领域适配层

只对具有稳定专业模式的任务进行SFT、LoRA或强化微调,例如:

这种方式既能保留通用模型的基础能力,也能增强其在光网络任务中的稳定性。

三、用课本和论文微调,能提升推理能力吗?

通常不能直接提升。

如果使用课本、论文等无标注语料对通用模型进行领域继续预训练,主要提升的是:

经过训练后,模型可能更加熟悉OSNR、ASE、非线性效应、ROADM和WSS等概念,也更容易理解论文和设备文档。

但这类训练的常见结果是:

模型说得更像光网络专家,却不一定做得更像光网络专家。

原因在于,课本和论文主要承载的是知识与结论,并不一定包含完整的任务求解过程。论文往往省略大量专家默认掌握的中间推理,教材也更关注概念和公式,而不是故障诊断、策略比较和操作决策。

因此,直接使用文献训练,能够增强模型“知道什么”,却未必能增强模型“如何解决问题”。

四、领域知识可以间接改善推理,但存在前提

知识与推理并不是完全割裂的。

如果模型不了解EDFA增益、ASE噪声、OSNR、BER以及上下游传播关系,就很难正确分析一条光链路的性能异常。因此,领域继续预训练可能通过补充必要知识,间接改善领域任务表现。

但这种提升通常需要满足几个条件:

也就是说,领域知识是推理的基础,但知识本身并不等于推理能力。

五、真正提升领域推理,需要训练“解决问题的过程”

要提升光网络任务中的推理能力,不能只向模型输入更多课本和论文,而需要将专业知识加工为完整的问题求解结构:

条件—现象—假设—证据—排除—结论—验证

例如,在故障诊断任务中,不应只告诉模型某种故障的定义,而应提供:

在性能优化任务中,则应进一步包含:

只有把这些真实案例、专家轨迹、仿真反馈和可验证奖励引入训练,模型才可能真正形成稳定的光网络推理和决策能力。

六、结论:从“训练一颗模型”转向“构建一套能力”

光网络需要垂域智能,但垂域智能并不等于垂域预训练模型。

仅依靠RAG,模型可能掌握了知识,却无法稳定执行复杂任务;仅依靠微调,模型又可能记住大量静态知识,却缺乏实时信息、精确工具和安全约束。

因此,更合理的方向不是简单争论“要不要光网络垂域大模型”,而是构建一套完整的光网络垂域智能系统:

以通用大模型提供基础理解与推理能力,以RAG和知识图谱提供专业知识,以结构化表示承载网络状态,以Skill和工具完成计算与执行,再通过轻量微调强化专家方法与行为。

从这个角度看,光网络未来真正需要的,可能不是一颗无所不包的“大模型”,而是一个以大模型为决策中枢、以知识和工具为专业能力来源的智能系统。

文献训练让模型更懂光网络,推理轨迹与反馈训练让模型更会解决光网络问题,而知识、模型、工具和工作流的协同,才真正构成光网络垂域智能。