再谈我们是否需要一个光网络垂域大模型

光网络需要的，究竟是垂域大模型，还是垂域智能系统？

自大模型技术兴起以来，光网络领域一直存在一个争议。

一种观点认为，光网络专业性强、知识复杂，通用大模型难以高效解决故障诊断、性能优化等垂域任务，因此必须构建专门的光网络垂域大模型。

另一种观点则认为，当前通用大模型已经具备较强的理解和推理能力，只需要通过RAG接入光网络知识即可。盲目微调甚至重新训练垂域模型，反而可能破坏原有的通用推理能力。

但问题的关键并不在于选择“RAG还是微调”，而在于先判断：模型缺的究竟是知识、方法，还是能力。

一、光网络需要垂域能力，但未必需要重训一颗垂域大模型

光网络确实具有较高的专业门槛。其任务通常涉及复杂拓扑、时序告警、物理性能、设备配置和操作约束，通用模型仅凭已有参数知识，很难稳定完成实际任务。

但这并不意味着必须从头训练一颗独立的光网络大模型。

更现实的技术路线是：

强通用模型底座 + 光网络知识系统 + 专业工具与工作流 + 必要的轻量微调。

其中，RAG和微调解决的是不同问题：

RAG主要提供事实和上下文，解决模型“不知道”的问题；
微调主要塑造方法和行为，解决模型“知道但不会稳定执行”的问题；
工具负责精确计算和实际操作，解决模型“不能只靠语言推测”的问题。

例如，设备手册、标准规范、历史问题单和实时网络状态适合通过RAG动态获取；根因定位流程、优化策略排序和安全操作规范，则更适合通过skill规范流程或者通过专家样本轨迹进行轻量微调。

因此，RAG和微调并不是相互替代的两条路线，而是垂域智能系统中的不同组成部分。

二、光网络真正需要的可能不是一颗模型，而是一套系统

一个可靠的光网络智能系统，至少应当包括五个层次。

1. 通用推理底座

选择推理、代码生成和工具调用能力较强的通用模型，充分继承其通用知识和逻辑推理能力，不轻易重新训练底座。

2. 领域知识层

通过文档RAG、问题单知识库、知识图谱、拓扑数据库、设备资产库和实时状态数据，为模型提供准确、可更新、可追溯的专业知识。

3. 领域表示层

将光网络中的图结构、时序事件和物理量，转换为模型能够稳定理解的结构化表示，例如拓扑子图、告警时间线、功率传播链和设备层级关系。

这一层往往比是否微调更加重要。再强的模型，如果输入仍然是冗长、含糊的自然语言拓扑，也很难完成稳定推理。

4. Skill与工具层

模型不应仅凭语言预测性能结果，而应调用专业工具完成拓扑查询、光性能仿真、日志解析、功率读取、策略验证和设备操作。

大模型负责理解意图、规划步骤和组织结果，确定性工具负责计算、执行与校验。

5. 轻量领域适配层

只对具有稳定专业模式的任务进行SFT、LoRA或强化微调，例如：

根因定位与证据链生成；
优化策略排序；
工具调用路径选择；
结构化报告生成；
安全操作与回滚决策。

这种方式既能保留通用模型的基础能力，也能增强其在光网络任务中的稳定性。

三、用课本和论文微调，能提升推理能力吗？

通常不能直接提升。

如果使用课本、论文等无标注语料对通用模型进行领域继续预训练，主要提升的是：

光网络知识覆盖；
专业术语理解；
领域文本建模；
公式和概念识别；
技术文档阅读能力。

经过训练后，模型可能更加熟悉OSNR、ASE、非线性效应、ROADM和WSS等概念，也更容易理解论文和设备文档。

但这类训练的常见结果是：

模型说得更像光网络专家，却不一定做得更像光网络专家。

原因在于，课本和论文主要承载的是知识与结论，并不一定包含完整的任务求解过程。论文往往省略大量专家默认掌握的中间推理，教材也更关注概念和公式，而不是故障诊断、策略比较和操作决策。

因此，直接使用文献训练，能够增强模型“知道什么”，却未必能增强模型“如何解决问题”。

四、领域知识可以间接改善推理，但存在前提

知识与推理并不是完全割裂的。

如果模型不了解EDFA增益、ASE噪声、OSNR、BER以及上下游传播关系，就很难正确分析一条光链路的性能异常。因此，领域继续预训练可能通过补充必要知识，间接改善领域任务表现。

但这种提升通常需要满足几个条件：

原始模型确实缺少关键光网络知识；
训练语料质量高、结构清晰；
目标任务高度依赖这些专业知识；
训练过程没有造成通用能力明显遗忘；
后续还进行了指令微调或推理训练。

也就是说，领域知识是推理的基础，但知识本身并不等于推理能力。

五、真正提升领域推理，需要训练“解决问题的过程”

要提升光网络任务中的推理能力，不能只向模型输入更多课本和论文，而需要将专业知识加工为完整的问题求解结构：

条件—现象—假设—证据—排除—结论—验证

例如，在故障诊断任务中，不应只告诉模型某种故障的定义，而应提供：

当前网络拓扑和设备状态；
告警与性能变化现象；
可能的故障假设；
每个假设对应的支持或反对证据；
排除其他原因的过程；
最终根因和验证方式。

在性能优化任务中，则应进一步包含：

不同策略的性能收益；
调节顺序；
中间态风险；
设备约束；
停止条件与回滚机制。

只有把这些真实案例、专家轨迹、仿真反馈和可验证奖励引入训练，模型才可能真正形成稳定的光网络推理和决策能力。

六、结论：从“训练一颗模型”转向“构建一套能力”

光网络需要垂域智能，但垂域智能并不等于垂域预训练模型。

仅依靠RAG，模型可能掌握了知识，却无法稳定执行复杂任务；仅依靠微调，模型又可能记住大量静态知识，却缺乏实时信息、精确工具和安全约束。

因此，更合理的方向不是简单争论“要不要光网络垂域大模型”，而是构建一套完整的光网络垂域智能系统：

以通用大模型提供基础理解与推理能力，以RAG和知识图谱提供专业知识，以结构化表示承载网络状态，以Skill和工具完成计算与执行，再通过轻量微调强化专家方法与行为。

从这个角度看，光网络未来真正需要的，可能不是一颗无所不包的“大模型”，而是一个以大模型为决策中枢、以知识和工具为专业能力来源的智能系统。

文献训练让模型更懂光网络，推理轨迹与反馈训练让模型更会解决光网络问题，而知识、模型、工具和工作流的协同，才真正构成光网络垂域智能。