
在全球数智化转型进入深水区的今天,通信网络已超越 “信息传输通道” 的单一属性,成为支撑数字经济运转的 “数字神经中枢”—— 其稳定性直接关联产业链供应链安全、民生服务保障乃至国家安全。然而,当前网络运维领域正面临一场运维范式困局:传统经验驱动的运维模式,已无法应对 2/4/5G 异构共存、跨厂家设备互联的复杂网络环境;新兴 AI 大模型虽具潜力,却因原生缺陷难以落地,成为自智网络从蓝图走向现实的鸿沟。这场困局的本质,是 “网络复杂度” 与 “决策可靠性” 的矛盾,亟待重构 AI 决策逻辑,重塑运维模式。
困局:经验运维与大语言模型幻觉之痛
网络运维领域的挑战正以前所未有的速度升级。特别是无线网络,其规模庞大、2/4/5G多制式共存、跨厂家的复杂异构性,构成了复杂的运维环境。当故障发生时,问题不再是单一的告警,而是一场“告警风暴”。故障根因通过网络拓扑“传播扩散”,产生大量冗余、衍生的告警,形成错综复杂的因果链条。
经验固化规则在面对跨专业连锁故障时,根因定位准确率低,往往需要运维人员二次判断根因,导致故障处理耗时长、影响最终用户的网络感知,代维成本亦居高不下,已成为阻碍高阶自智网络演进的关键瓶颈。大语言模型(LLM)的兴起似乎带来了曙光,然而将其直接应用于专业性强的网络运维场景,却又面临着新的“水土不服”挑战:一是多模态语义对齐困难,LLM难以直接关联抽象的网络拓扑图与具体的告警文本;二是决策的“黑盒”特性,其推理路径不可解释、难以追溯,无法建立运维人员的信任;三是因果推理能力薄弱,LLM容易将统计相关性误判为因果关系,导致决策出现偏差。
破局:以“图”为锚,用“智”穿透——铸造白盒化AI的融合新架构
中国移动和中兴通讯联合成立“联创+”自智网络开放实验室,研究并提出网络图模型赋能故障根因推理的通用解决方案,其核心并非简单使用LLM,而是构建“知识图谱(Knowledge Graph)为通信网络领域知识骨架,图谱混合搜索(Hybrid Search)为关联引擎,强推理大模型为逻辑核心”融合架构,打造可靠、稳定、精准的AI分析决策能力,加速模式变革和运维流程重塑。
第一步:构建领域知识图谱骨架,奠定智能基石
智能决策的前提,是让 AI “读懂” 网络。实验室创新性地以 “静态 + 动态” 统一建模,构建通信网络知识图谱,实现多元数据的语义互联:
静态资源拓扑图:将无线、传输、动环等跨专业对象(含小区、RRU、板卡、光口、设备、机房等11 类资源节点)及其物理 / 逻辑连接关系细粒度建模,形成网络的数字地图—— 这不仅是设备对象的罗列,更是对谁与谁相连、如何联动的拓扑逻辑描述,为故障定位提供网络拓扑空间。
静态故障传播图:利用 LLM 从告警手册、历史案例、专家文档中自动化抽取故障知识(生成 RDF 三元组),经融合消歧后形成统一传播图谱,再通过图神经网络(GNN)补全缺失连接。例如,针对 “RRU 链路断→小区退服” 的传播链,GNN 可补全 “光口链路故障→RRU 链路断” 的前置因果,为 AI 提供完整的逻辑依据,从源头减少 LLM 幻觉。
动态根因推理图:实时告警发生时,将告警信息精准挂载至资源拓扑图对应节点,使静态拓扑与动态告警有机融合 —— 这张动态图谱,既是网络健康状态的 “实时仪表盘”,也是 AI 推理的事实数据库。
第二步:精准喂料,图搜索与剪枝高效聚焦关联上下文
大模型的推理质量,取决于输入信息的 “精准度” 与 “关联性”。实验室提出符合通信网络拓扑特点的 “图谱混合搜索” 策略,本质是 “按图索骥” 的智能筛选:通过融合故障传播知识与动态推理图,结合时空关联进行子图剪枝、合并与分层压缩,最终提取出 “根因推理子图”。这一过程实现两大价值:一是过滤 90% 无关信息,确保关键故障逻辑无损继承;二是将告警、拓扑、传播关系整合为结构化图谱,使大模型 Token 开销降低 20%,推理亲和性与准确性显著提升 —— 让 AI 不再面对海量数据 “无的放矢”,而是聚焦高关联故障上下文。
第三步:深度推理,以因果思维链实现决策升维
强推理大模型在此架构中,不再是 “文本生成器”,而是 “网络故障逻辑分析师”。实验室通过精心设计的因果思维链(Chain-of-Thought),引导大模型逐层穿透故障表象:从告警挂载节点出发,沿拓扑链路追溯传播路径,结合故障传播图验证因果关系,最终对多因素混杂的复杂故障(如跨基站退服)进行全局推导。这种推理模式突破了传统规则的 “一场景已规则定制限制”,实现根因定位准确率超 90%,更能以结构化语言输出 “根因结论 + 处理步骤”,真正突破了传统经验规则的局限性。
第四步:透明可信,全流程可解释回溯打破AI决策“黑盒”
为彻底打破传统LLM“黑盒”决策的痛点,构建运维人员对AI决策的信任,该解决方案将动态推理图、子图、推理过程可视化,实现逻辑可视、可解释、可回溯。当大模型输出“根因为某传输环路光缆中断,导致批量基站退服”的结论时,同步在可视化界面上高亮呈现从故障告警基站到根因设备的完整推理图谱和分析路径,并明确附上其所依据的故障传播知识。
为破解 LLM “黑盒” 痛点,实验室将全流程可视化:当 AI 输出 “传输环路光缆中断导致批量基站退服” 结论时,可视化界面会同步高亮 “退服基站→中间传输路由→根因网元→根因分类” 的完整推理路径,并标注依据的故障传播知识和传播链路。这种“白盒化”的呈现方式,使得运维人员能够清晰、直观地理解AI的“思考过程”和决策逻辑,如同翻阅一本透明的“AI诊断报告”。这不仅极大地增强了运维人员对AI结论的信任度,也为故障的复盘、知识库的持续迭代、以及运维人员技能的提升提供了坚实的基础,真正做到了让AI“知其然,并知其所以然”。
价值牵引创新,引领高阶自智
网络领域知识图谱与大模型的融合推理提供了更可靠、更通用、更精准、更高效的解决方案,AI的深度思考能力真正突破了经验规则的局限性,实现了AI的自主智能决策,加速高阶自智网络演进。技术研究成果在北京昌平试点,收集现网无线故障1200+真实评测数据,验证得出使用知识图谱+大模型的融合推理准确率达到90%,代维上站次数下降5%,缩短代维处理时长40%。
“联创+”自智网络开放实验室秉承“技术共研、场景共创、生态共建”的理念,探索了一套科技成果从研发到现网试点、再到规模应用的快速转化机制,共同破解高阶自智网络演进过程中的关键难题,引领全球自智网络的标准共建与生态繁荣。
