2025年,生成式AI领域迎来关键发展期,基础大模型尤其是多模态大模型技术突破频现,正从技术创新向产业应用深度渗透,成为驱动数字经济发展的重要智能引擎。近日,IDC中国研究总监介绍,2025年1月至5月,国内外科技企业围绕基础大模型展开密集技术布局,多模态大模型的持续突破推动生成式AI从技术创新阶段向产业重塑阶段加速演进。
基础大模型技术突破显著,多模态成主流方向IDC
最新研究显示,2025年1月至5月,国内外多家科技企业密集发布新一代大模型产品。1月,MiniMax推出包含文本和视觉语言模型的MiniMax-01系列,DeepSeek-R1、Kimi k1.5等模型也相继问世;2月,Qwen2.5-Max、Claude 3.7等模型发布;3月,Qwen2.5-Omni-7B、文心大模型4.5及文心大模型X1混元T1正式版等上线;4月,Joy industrial Claude 4系列、豆包语音播客模型等推出;5月,Llama 4、Firefly Image Model 4 Ultra等模型发布。
从技术路径看,多模态大模型成为主流发展方向。阿里巴巴通义千问2.5 Omni、百度文心大模型4.5、科大讯飞星火多模态大模型等产品,在文本、图像、音频、视频等多模态理解与生成能力上持续提升。例如,商汤日日新Sense Nova V6、字节跳动豆包视频等模型,进一步拓展了多模态应用场景。
生成式AI市场快速增长,企业应用需求旺盛
技术突破推动生成式AI软件市场规模持续扩大。数据显示,2024年中国生成式AI软件市场规模约48.9亿元,预计到2028年,大模型开发软件公有云模式市场规模将达208.5亿元,生成式AI应用软件公有云模式市场规模将达140.7亿元。
企业在AI平台建设中更注重实际应用能力与现有基础设施的集成。调研显示,43.8%的企业将“开发人工智能和生成式人工智能应用的能力”作为评估AI平台的最重要因素,43.6%的企业关注“与现有IT基础设施的集成”。在部署方式上,40.3%的企业倾向于“能在公有云和专用环境中部署模型或应用”。
消费级应用全面爆发,重塑多行业生态
消费级市场成为生成式AI应用爆发的重要领域。智能助手、AI搜索、语音、图像、视频等领域涌现出众多典型应用。例如,DeepSeek、豆包、Kimi等智能助手提供智能问答、日程管理等服务;秘塔AI搜索、纳米AI搜索等满足学术研究、专业资料查询需求;魔音工坊、通义听悟等助力语音创作与记录;美图秀秀在图像生成与设计领域广泛应用;快手可灵、万兴天幕等实现视频自动剪辑与多模态内容创作。
在智能硬件领域,小米小爱、雷鸟眼镜等产品通过AI技术提升用户体验;汽车行业中,小鹏、理想等企业的自动驾驶辅助系统借助AI技术实现实时路况导航与车路协同。
未来发展趋势明朗,开源与多端部署成关键
IDC预测,未来24个月,基础大模型发展将呈现多大趋势。“多模态”“具身智能”“端侧推理”等成为关键词,开源多模态基础模型与大型专有模型的性能差距将不断缩小。
企业对统一AI平台的能力要求不断提高,需要平台具备生成式AI生命周期管理、私有化云平台集成、模型中枢构建、RAG管道开发等能力,同时实现轻松部署、治理与监控。
随着技术的持续进步与应用的深入拓展,生成式AI正从工具层面向基础设施层面演进,未来有望成为核心操作系统,为各行业数字化转型提供强大动力。卢言霞表示,企业应积极拥抱大模型与生成式AI应用,在内部鼓励员工尝试AI开发工具,提前布局未来技术变革带来的机遇。