图源:上海人工智能实验室

上海人工智能实验室主任周伯文:通专融合是通往AGI的战略路径|WAIC2024

界面新闻记者 | 陈振芳

界面新闻编辑 | 文姝琪

AGI落地会有一个高价值区域,这要求模型兼备很强的泛化能力和足够的专业性。区域离原点最近的位置,叫做通专融合的“价值引爆点”,处在这个点的大模型,在专业能力上应超过90%的专业人类,同时具备强泛化能力,即ABI(广义人工智能)能力。

7月4日,2024世界人工智能大会暨人工智能全球治理高级别会议(WAIC 2024)在上海开幕。上海人工智能实验室主任、首席科学家,清华大学惠妍讲席教授,衔远科技创始人周伯文在WAIC 2024科学前沿主论坛上发表开场报告时,做出上述判断。

对应AGI发展之路,周伯文创造了两个词:ANI(狭义人工智能)和ABI(广义人工智能)。周伯文指出,通向AGI的必经之路是ABI,后者在学术上的严格定义为:自监督、端对端、从判别式走向生成式,“ChatGPT出现的时候,基本上实现了这三个要素,即2022年底已经进入ABI时代。”

图源:上海人工智能实验室

回看AI发展历史,在2016、2017年以前,人工智能在专业能力上拥有非常迅猛的进展,但这些模型不具备泛化能力,只在专有任务上表现突出。

2017年Transformer提出后,大模型开始在泛化能力上的“狂飙”。但当时的大模型在专业能力的进展上极其缓慢,同时带来巨大的能源消耗、数据消耗、资源消耗。

Sam Altman曾提到,GPT-4的专业能力,大概相当于10%-15%的专业人士,即使到未来的GPT-5,预期将会提高四到五个点,即用指数级的能源消耗增长换来缓慢的专业能力提升。

图源:上海人工智能实验室

“谁先进入高价值区域,意味着谁的能力更强,拥有更多的场景和数据飞轮,并因此更早拥有自我进化迭代的能力。”

周伯文认为,强泛化的专业能力是AI皇冠上的明珠,即通专融合新范式,应瞄准构建一个既具有泛化性又具备专业能力的AI系统,最终能够更高效、更好地适应和解决现实世界中的复杂问题。

而实现上述目标需要一个完整的技术体系,有三大重点工作要完成。

之一,要在基础模型层构建通用泛化能力,尤其是高阶能力,如数理、因果推理等。通过高质量数据的清洗和合成,研发高性能训练框架、高效的模型架构。

第二,要在融合协同层将泛化性和专业性有效地结合起来,采用多路线协同的算法和技术,构建比肩人类优秀水平的专业能力。这将使得AI能够在复杂环境中做出决策,将复杂任务分解为更易管理的子任务,制定行动计划,并有效协调多个智能体,以实现群体智能的涌现。

第三,在自主进化与交互层,AI能够完成自主探索和反馈闭环。即AI系统需要在真实或仿真世界中自主地收集数据、学习并适应环境。

“在科学发现领域,通专融合也有着巨大的潜在价值。”周伯文表示。

2023年初,Nature曾发表过一篇对科研论文发展现状持悲观态度的封面文章,指出“科学进步正在降速”,引发巨大反响。

“大模型的不确定性和幻觉生成,并不总是缺陷,而是它的特点之一。”

周伯文认为,合理利用这种特点,通过人机协同有助于促进科研创新。大模型内部压缩着世界知识,同时具备不确定性生成的特性,极有可能帮助人类打破不同学科领域知识茧房,进行创新式探索。

通专融合后,AI可以提出科学假设,掌握科学知识、分析实验结果、预测科学现象。进而在反思的基础上,提升AI提出科学假设的能力。

周伯文介绍称,为了更高效地构建通用基础模型,上海人工智能实验室在并行训练及软硬适配协同、高效数据处理、新型架构及推理增强等方面进行了一系列探索。

举例来说,上海人工智能实验室分别在化学和育种两个方向构建了首个开源大模型——书生·化学和书生·丰登。在分析实验结果方面,实验室研发的晶体结构解析算法AI4XRD具备专家级的准确率,并将解析时间从小时级降低到秒级。

而在预测科学现象方面,训练并持续迭代了风乌气象大模型,在全球中期气象预报上具有领先的时间和空间分辨率。

周伯文指出,具身自主探索是实现通专融合的有效手段,也是理解物理世界的AGI的必经之路。但具身智能不仅仅是大模型加机器人的应用,而是物理世界的反馈需要及时进化大模型。

为帮助建立世界模型,上海人工智能实验室构建了“软硬虚实”一体的机器人训练场——“浦源·桃源”,这是首个城市级的具身智能数字训练场,构建了集场景数据、工具链、具身模型评测三位一体的开源具身智能研究平台。作为大模型与机器人的连接层,其涵盖89种场景、10万+可交互数据,最终解决领域内数据匮乏、评测困难的问题。

“浦源·桃源”模型同时攻关具身智能的“大脑”与“小脑”。在大脑方面,通过具身智能体在自身状态认知、复杂任务分解分配、底层技能协同控制的三方面创新,首次实现了大模型驱动的无人机、机械臂、机器狗三种异构智能体协同。

在小脑方面,通过GPU高性能并行仿真和强化学习,实现机器人在真实世界里快速学习,完成高难度动作,单卡1小时的训练就能实现真实世界380天的训练效果。

在基础模型方面,上海人工智能实验室旗下大语言模型书生·浦语2.5,实现了综合性能比肩开源大模型参数的性能。多模态大模型书生·万象,通过渐进式对齐、向量链接等创新技术,实现了用更少算力资源训练高性能大模型的道路。该模型以260亿参数,也能达到了在关键评测中比肩GPT-4的水平。

“对于可信AGI的未来,我们的态度是坚定而积极的:We must be there. We will be there,我们必须达成,我们终将抵达。”周伯文最后总结道。