近年来,生成式人工智能的发展如火如荼,从通用大模型、行业大模型,到智能体、智能机器人。大模型和智能体的方式都有研发和应用之意,前者研发的理论性多些,后者更倾向应用研发,都力图尽快进入应用。但发展过程难免存在认知和操作上的一些矛盾。将AI研发与应用统一起来,旨在提升人工智能水平、促进人工智能产业发展。
生成式AI在研发与应用过程的矛盾
AI发展无疑会带来巨大潜力和广阔的应用前景。对AI大模型、行业模型、智能体、机器人的研发,是科学、技术,还是工程,有不同的说法,也引发研发和应用上的若干分歧。
1、大模型研发扩张与应用减缓的矛盾
大模型的出现颠覆了人们的认知,在惊叹其大突破的同时,不少公司将大模型研发作为投资热点,抢占制高点,但起初对大模型规律并不清晰,研发中面对庞大的算力、规模数据和算法的要求,200多家公司从事大模型研发有可能造成重复建设、资源浪费。虽然通用大模型在营销、办公、客服、人力资源、基础作业等领域也开始一些应用,但对AI已有成果的应用有所减缓。而且通用大模型更适合to-c,面向产业转化较少,而投资、科技、企业、社会、媒体都将眼光盯在模型的功效上。以至有人呼吁不要卷模型,要卷应用。没有应用,大模型将一文不值。事实上,也不能让人们的注意力长期停留在对大模型的争论和焦虑中,要让搞科技的人关注AI深入研发,让更多企业集中在AI已有成果的应用,在发挥各自作用中推进人工智能的探索和发展。
2、通用大模型与行业大模型的差异
AI大模型研发从全面探索转向规模试点和特定领域的智能生成,需要根据不同领域的需求定制AI解决方案。通用大模型、行业大模型,都是生成式AI的崭新探索,前者倾向广泛领域和理论研发,后者多是特定领域的应用研发。由于研发通用大模型数据需求量大,算力损耗多,很难较快地应用落地,于是不少公司转向行业、产业和企业的垂直模型研发,这是探索和实践中的选择。围绕大模型的深入研发和已有成果的尽快应用,在争论中逐渐形成两种较为明显的态度:一种是追求技术,主张走通用大模型之路,提高“更大更强的AI能力”;一种是将AI成果尽快用到市场,要多发展行业模型,走产业之路,认为将“足够的AI能力”投入快速变现到商业场景,用市场庞大而独特的数据构筑壁垒。两者都有道理,但易走极端,应该倡导两者相互理解吸收,把力量集中在符合我国实际的研发和应用上,推进“人工智能+”的落地和发展。
3、开源模式与闭源模式的张力
大模型的开源和闭源是研发企业选择的不同模式。开源是开放源代码,允许任何人获得并修改软件的源代码,通过更大范围的开发者、研究者和爱好者的合作,拓宽技术创新边界,为人工智能发展注入活力。闭源是将软件源代码仅由软件编写者或系统开发商掌握,通过核心技术和商业模式的保护,使企业从技术成果中获得经济回报,在涉及敏感信息和高安全要求领域,闭源形式尤为重要。两种模式反映技术进步与社会价值、经济效益与安全保障之间的平衡探索。开源和闭源之争实际是对这种平衡的不同选择和追求。选择开源的企业希望通过全球合作推动技术创新和应用发展;选择闭源的企业以保护其技术和商业利益为主。例如,Open AI 发布的o1模型,在交互过程中默认隐藏了思维链,也可能不想让其他开发者和用户看到模型思考过程。开源和闭源彼此的张力,体现在商业模式和技术选择上,反映不同企业对未来发展的战略考虑。
黑石集团董事长苏世民认为,企业更有利于研发大模型,从数据积累、算力投入、研发本身的技术和工程性质,似乎企业比大学研发更有优势,更易突破。而且通用大模型研发还可给行业模型、智能体以及各行各业赋能,应用中各行业丰富的场景、海量的数据、优势的资源投入,又在强化通用大模型研发,使科技研发和应用相辅相成,达到统一。
如何将AI研发与应用统一起来
AI的研发和应用是逻辑发展的统一,出现上述现象有着特殊背景和原因,需在深入发展中化解。
1、发展链路将研发与应用统一起来
大模型出现以来,生成式人工智能逐渐形成“大模型—行业模型—智能体—机器人”的发展链路。各环节都有相对独立性,按照技术逻辑,它们排列有序地发展。
一要重点发展几家通用大模型,提高我国AI技术竞争力。对通用大模型尚无统一的定义,多数人理解的大模型,包括大语言模型和多模态大模型。通用大模型在技术和理论上展现出强大能力,可为各个领域赋能并带来机遇,是重塑人类社会的重要因素。通用大模型不仅需要的参数规模大,算力规模大,而且在遇到数据瓶颈、算力瓶颈的情况下,走到无尽的前沿,不知道还要多长时间、还需多大投入,才能有新的突破。月之暗面的CEO杨植麟认为解,Open AI o1模型就是在天然数据不够用时,用较好的基础模型强化学习,创造出很多非天然数据,提高了数据质量和计算效率,进而产生出更深入的思考和推理,实际上他们创新出一种新的范式。
深入研发通用大模型,需要不断挑战,奔向通用人工智能的目标。因此,搞大模型研发的企业不必过多。由于美国对我采取AI技术限制,我国必须要有一些具备世界竞争力的通用大模型。人工智能专家吴军认为,“现在全世界大模型成规模的没几家,美国大概5-10家,欧洲基本上就法国一家,若每个国家建一个大模型不可能,这很烧钱,我国应重点扶植不超过10家。”目前,我国的baichuan3、智谱glm-4、腾讯混元、通义千问2.1、文心一言4.0、华为盘古、月之暗面的Kimi、抖音的豆包、阿里通义千问Qwen2、可灵AI等大模型走在前列,除上述大模型做得好的公司,我国互联网大厂、相关大型企业拥有规模数据,有实力解决算力问题,也符合大模型研发的条件。
大模型具备通识和泛化能力,由于应用中存在数据隐私和算法偏见、数学和逻辑推理能力不足等问题,通用大模型很难满足具体行业的特定需求、专业性能和经济效率,缺少细分度更高的产品,在公有云提供服务中会造成企业私有数据、敏感数据安全性的担忧,使用中还需通过传统的磨合流程来实现产品与市场的契合,将通用大模型融入核心业务流程的案例不多,而行业大模型更有利于发展专业能力和精准赋能。但也有专家认为,现在的产品很大程度由模型能力决定,要把产品和模型更紧密地结合起来去思考。比如产品上想做一个功能,背后需要对应模型能力的支撑。还有互联网大厂的企业家强调大模型赋能智能体,其实践意义更大,应用前景广阔。
二要大力发展行业模型和业务模型,发挥我国产业齐全和技术应用的优势。行业模型“利用通用大模型技术,针对特定数据和任务进行训练或优化,形成具备专用知识与能力的模型及应用。国际上更多用垂直模型来表示,我国还有垂类模型、领域模型、专属模型等称谓。” 行业模型本质上是解决方案。从用户在乎产品而非技术的实际出发,尽快把技术转化成产品,才有利解决问题。行业大模型提供的不仅是产品和工具,还有定制服务与支持,需要客户参与共建。
一方面,企业为提升竞争力和智能化转型,满足市场需求,想将数据转化为核心驱动,主动寻找最佳模型;另一方面,AI技术公司也在选择对人工智能提升发展质量有需求的特定行业、企业、产业开展合作。研发方和需求方结合,共同深耕 “人工智能+行业\产业\企业”,利用行业专业数据或私有数据、特色应用场景等独特资源,对模型定制调整和优化,会较快地进入应用,针对性地解决问题,产生价值。行业模型和智能体是相互关联和互补的技术,共同推动AI技术的产业化。
三要把智能体和机器人作为智能发展的重点,培植和壮大智能产业。智能体是具有智能的实体。以云为基础,以AI为核心,构建一个立体感知、全域协同、精准判断、持续进化、开放的智能系统。智能体包括智能行为的物理实体和虚拟存在,比如物理形态的机器人和虚拟形态的数字人。
智能体远超近年国内使用的Siri、小爱同学、天猫精灵等智能助手。智能体可以帮助我们处理更加复杂的任务。在大模型技术加持下,智能体将具有自主性、感知性和行动能力,在复杂环境中自主决策、学习进化,更接近人类智能本质。随着新型芯片技术的涌现,将会出现无人汽车、无人机、机器人等颠覆性的智能体,将实现更高层次的智能化。这种应用驱动的AI研发,目的使智能体成为人类广泛使用的商品,并根据使用环境和用处,按需求定制形状、大小及功能不同的智能体。
机器人是智能体中重要的一种,跟传统机器人相比,具身智能机器人有泛化性优势。传统工业机器人可解决固定搬运、固定点位的焊接、喷涂等相对固定的方式的问题,但在工序复杂的总装过程,工业机器人还不如人工安装。大模型赋能的智能机器人就可应对此类问题。工业用智能机器人会快于家用机器人落地应用,约在3到7年可批量生产。家用机器人因任务复杂程度高,任务完成的满意程度不同,需要5到10年才可量产。
上述智能方式都需技术研发,都有很高应用价值,共同构成人工智能发展格局。研发为应用打基础,应用是研发的目的,宏观上体现了研发与应用的统一。
2、扬长避短将AI研发和应用统一起来
AI发展有研发、应用等环节,但并非每个企业都要按顺序将各环节做一遍。在全球化、数智化、市场化条件下,要扬长避短才能在AI的发展中相互成就和发展。目前,在人工智能各环节,美国处于研发领先地位并带动着应用。美国去工业化后,其产业结构以金融和服务业为主,通用大模型的应用,主要覆盖金融、财务、审计、研发、法律、医疗等领域。我国产业齐全、制造业发达,更适合AI快速应用于产业、行业和社会。加之我国具有互联网应用、数字技术应用的经验,在通用大模型研发带动下,已在金融、服务、文教、医疗、创作等通用模型易应用的领域广泛落地。
现在除加大几家通用大模型研发力度外,要发挥我国技术应用优势,重点加强AI行业大模型、业务模型、智能体、机器人等不同方式的应用研究。使少数骨干公司的大模型研发成为赋能各项AI应用的“蓄水池”,使AI各种方式的应用直接服务于具体产业,使它们既承接通用大模型的技术赋能,又能结合行业、企业和社会应用的场景和需要,向着智能产业、智能应用的方向发展,并将丰富的应用场景等资源和问题反哺大模型、行业模型的研发,形成通用大模型与AI应用“相辅相成、相互促进”的良性循环。
3.运用灵活方式将研发与应用统一起来
2023年中期,我国200多家公司相对集中在通用大模型的研发上,在全球研发大模型的数量最多。随着AI技术逻辑的演进,不断深化对大模型的认识,无论从能力、需求、成本、市场等方面看,不需要更多公司都挤在大模型研发的独木桥。当初一些研发大模型的公司,转变到AI应用研究或AI应用的方向。一种方式是,原先做大模型的公司改做行业大模型,它们积累了扎实的知识基础和丰富的交互体验,知道如何承接大模型的技术赋能,从而做好行业模型。另一种方式是,基于一些通用大模型的开源模式,开展行业大模型研发,能对模型结构、参数等按需调整,更好地适配个性化应用需要。“市场上诸多金融、法律、教育、传媒、文旅等行业模型,大多是在Llama、SD、GLM、Baichuan等国内外主流开源大模型基础上构建的。” 两种方式都不用过大的算力和数据,省去很多训练时间和成本,又能放心地利用私有数据提升应用效果,减少数据安全疑虑,很好地将AI技术研发转化到应用研究上来。
还有一种方式,就是开发比行业模型更灵活的领域模型或业务模型,它适合国内市场极度丰富的业务场景,能促成生成式人工智能商业化。领域模型更适合超大规模的AI应用市场和多种服务模式。中国信息通信研究院公布的数据显示,2023年我国人工智能产业应用进程持续推进,核心产业规模达到5784亿元。不少属于行业大模型和领域模型以及AI工具的应用。有家公司2023年做AI视频面试,比上年翻了一倍以上。现在校招面试成本很贵,他们用AI视频取代微信私域营销,面试打分客观,还会追问应试者,场景很多,达到降本增效的目的。义乌一个女老板应用前沿的AI视频,化身语言达人,熟练切换多国外语,介绍自家生意,打造了全新的应用场景。诸如此类的AI研发和应用,都值得推广。
提升人工智能发展质量和价值的建议
我国人工智能的研发势头正旺,智能产业前景乐观,AI应用将会蓬勃发展。从目前的探索和实践看,尚需夯实AI的基础建设,致力于技术创新,拓宽商用渠道,统筹处理AI的研发、产业化和应用的关系。
1、营造良好的政策和服务环境
我国已就AI的标准、能力、伦理、创新、治理等方面,出台了相关政策和法律,以确保技术发展符合社会的价值观和伦理标准,形成拥抱AI发展的社会环境,政府部门、行业协会和市场监管方面,对刚起步的生成式AI的研发和应用,应多包容,多服务,逐渐引导规范,使其走上健康的智能发展路子。
2、AI技术产业化要为产业的智能化开路
网络运营商、软硬件设备终端提供商、互联网企业,是大模型应用的先行者。它们数字化程度高、数据积累丰富、技术接受能力强,会成为大模型落地较早的行业。这些行业的大模型应用场景广泛,覆盖了营销、客服、内容生成等诸多环节,目前已有丰富和成熟的经验,它们的带动示范和提供的大模型服务、工具、产品,正在传导到制造等产业,促进企业从数字化向智能化转型升级。随着各种智能方式和载体逐渐成熟落地,企业会在改造、提升传统产业的同时,向着产业智能化快速发展。
3、打造坚实的AI技术底座
加大算力中心建设力度,促进算力统筹协同,随着国产算力性能和易用性的提升,将会获得AI公司和应用企业的青睐;要有效地积聚高质量的数据,扩大数据交易,发挥数据的资源和要素作用;以创新精神研发智能产业的不同载体,避免同质化,体现技术、产业和应用的特点和优势,创造与众不同的产品和服务,提升价值,积极推广。
*本文刊载于《通信世界》
总第956期 2024年11月25日 第22期