光网络需要的,究竟是垂域大模型,还是垂域智能系统?
自大模型技术兴起以来,光网络领域一直存在一个争议。
一种观点认为,光网络专业性强、知识复杂,通用大模型难以高效解决故障诊断、性能优化等垂域任务,因此必须构建专门的光网络垂域大模型。
另一种观点则认为,当前通用大模型已经具备较强的理解和推理能力,只需要通过RAG接入光网络知识即可。盲目微调甚至重新训练垂域模型,反而可能破坏原有的通用推理能力。
但问题的关键并不在于选择“RAG还是微调”,而在于先判断:模型缺的究竟是知识、方法,还是能力。
一、光网络需要垂域能力,但未必需要重训一颗垂域大模型
光网络确实具有较高的专业门槛。其任务通常涉及复杂拓扑、时序告警、物理性能、设备配置和操作约束,通用模型仅凭已有参数知识,很难稳定完成实际任务。
但这并不意味着必须从头训练一颗独立的光网络大模型。
更现实的技术路线是:
强通用模型底座 + 光网络知识系统 + 专业工具与工作流 + 必要的轻量微调。
其中,RAG和微调解决的是不同问题:
- RAG主要提供事实和上下文,解决模型“不知道”的问题;
- 微调主要塑造方法和行为,解决模型“知道但不会稳定执行”的问题;
- 工具负责精确计算和实际操作,解决模型“不能只靠语言推测”的问题。
例如,设备手册、标准规范、历史问题单和实时网络状态适合通过RAG动态获取;根因定位流程、优化策略排序和安全操作规范,则更适合通过skill规范流程或者通过专家样本轨迹进行轻量微调。
因此,RAG和微调并不是相互替代的两条路线,而是垂域智能系统中的不同组成部分。
二、光网络真正需要的可能不是一颗模型,而是一套系统
一个可靠的光网络智能系统,至少应当包括五个层次。
1. 通用推理底座
选择推理、代码生成和工具调用能力较强的通用模型,充分继承其通用知识和逻辑推理能力,不轻易重新训练底座。
2. 领域知识层
通过文档RAG、问题单知识库、知识图谱、拓扑数据库、设备资产库和实时状态数据,为模型提供准确、可更新、可追溯的专业知识。
3. 领域表示层
将光网络中的图结构、时序事件和物理量,转换为模型能够稳定理解的结构化表示,例如拓扑子图、告警时间线、功率传播链和设备层级关系。
这一层往往比是否微调更加重要。再强的模型,如果输入仍然是冗长、含糊的自然语言拓扑,也很难完成稳定推理。
4. Skill与工具层
模型不应仅凭语言预测性能结果,而应调用专业工具完成拓扑查询、光性能仿真、日志解析、功率读取、策略验证和设备操作。
大模型负责理解意图、规划步骤和组织结果,确定性工具负责计算、执行与校验。
5. 轻量领域适配层
只对具有稳定专业模式的任务进行SFT、LoRA或强化微调,例如:
- 根因定位与证据链生成;
- 优化策略排序;
- 工具调用路径选择;
- 结构化报告生成;
- 安全操作与回滚决策。
这种方式既能保留通用模型的基础能力,也能增强其在光网络任务中的稳定性。
三、用课本和论文微调,能提升推理能力吗?
通常不能直接提升。
如果使用课本、论文等无标注语料对通用模型进行领域继续预训练,主要提升的是:
- 光网络知识覆盖;
- 专业术语理解;
- 领域文本建模;
- 公式和概念识别;
- 技术文档阅读能力。
经过训练后,模型可能更加熟悉OSNR、ASE、非线性效应、ROADM和WSS等概念,也更容易理解论文和设备文档。
但这类训练的常见结果是:
模型说得更像光网络专家,却不一定做得更像光网络专家。
原因在于,课本和论文主要承载的是知识与结论,并不一定包含完整的任务求解过程。论文往往省略大量专家默认掌握的中间推理,教材也更关注概念和公式,而不是故障诊断、策略比较和操作决策。
因此,直接使用文献训练,能够增强模型“知道什么”,却未必能增强模型“如何解决问题”。
四、领域知识可以间接改善推理,但存在前提
知识与推理并不是完全割裂的。
如果模型不了解EDFA增益、ASE噪声、OSNR、BER以及上下游传播关系,就很难正确分析一条光链路的性能异常。因此,领域继续预训练可能通过补充必要知识,间接改善领域任务表现。
但这种提升通常需要满足几个条件:
- 原始模型确实缺少关键光网络知识;
- 训练语料质量高、结构清晰;
- 目标任务高度依赖这些专业知识;
- 训练过程没有造成通用能力明显遗忘;
- 后续还进行了指令微调或推理训练。
也就是说,领域知识是推理的基础,但知识本身并不等于推理能力。
五、真正提升领域推理,需要训练“解决问题的过程”
要提升光网络任务中的推理能力,不能只向模型输入更多课本和论文,而需要将专业知识加工为完整的问题求解结构:
条件—现象—假设—证据—排除—结论—验证
例如,在故障诊断任务中,不应只告诉模型某种故障的定义,而应提供:
- 当前网络拓扑和设备状态;
- 告警与性能变化现象;
- 可能的故障假设;
- 每个假设对应的支持或反对证据;
- 排除其他原因的过程;
- 最终根因和验证方式。
在性能优化任务中,则应进一步包含:
- 不同策略的性能收益;
- 调节顺序;
- 中间态风险;
- 设备约束;
- 停止条件与回滚机制。
只有把这些真实案例、专家轨迹、仿真反馈和可验证奖励引入训练,模型才可能真正形成稳定的光网络推理和决策能力。
六、结论:从“训练一颗模型”转向“构建一套能力”
光网络需要垂域智能,但垂域智能并不等于垂域预训练模型。
仅依靠RAG,模型可能掌握了知识,却无法稳定执行复杂任务;仅依靠微调,模型又可能记住大量静态知识,却缺乏实时信息、精确工具和安全约束。
因此,更合理的方向不是简单争论“要不要光网络垂域大模型”,而是构建一套完整的光网络垂域智能系统:
以通用大模型提供基础理解与推理能力,以RAG和知识图谱提供专业知识,以结构化表示承载网络状态,以Skill和工具完成计算与执行,再通过轻量微调强化专家方法与行为。
从这个角度看,光网络未来真正需要的,可能不是一颗无所不包的“大模型”,而是一个以大模型为决策中枢、以知识和工具为专业能力来源的智能系统。
文献训练让模型更懂光网络,推理轨迹与反馈训练让模型更会解决光网络问题,而知识、模型、工具和工作流的协同,才真正构成光网络垂域智能。