界面新闻记者 | 何柳颖

对话招商银行俞吴杰:招行重点不在搭建通用模型,而是搭建金融行业的领域模型

界面新闻编辑 | 江怡曼

AI浪潮正在重塑银行业。

德勤今年8月发布的一份报告指出,曾经需要银行投入大量人力才能解决的各类挑战在人工智能时代或将迎刃而解。例如过往银行职能部门需通过增加训练有素的员工才能提升业绩这一局面,人工智能技术将对其带来变革性影响。AI技术的应用带来了运营效能的巨幅提升,与雇佣更多员工相比,该技术能实现同等产能提升的边际成本更低。

不仅如此,“游戏规则”或将被改写。德勤表示,我们从与全球各大银行的业务合作中发现,领先创新机构正奋力推动跨越式转变。人工智能将不再是“战术工具”(即加速当前商业计划的交付),而将升级成为“战略决定因素”(即未来业务规划将围绕人工智能能力构建展开)。

“AI已经融入到银行日常的营销、服务、经营各个方面。”近日,围绕银行业的AI布局思路与实践,招商银行信息技术部副总经理俞吴杰接受了包括界面新闻记者在内的媒体采访。俞吴杰谈及,银行日常工作中存在很多重复性的、简单的流程化工作,而这恰巧是大语言模型能够发挥作用的地方。

俞吴杰 受访者供图​​​​

俞吴杰透露,针对AI与大语言模型,目前招行的重点在于智算平台的建设。“原来的服务器集群叫通算平台,和大模型相关的叫智算平台。智算平台既包含招行的训练平台,也包括推理平台。”他提到,招行探索大模型的目标不是建立通用模型,而是在金融行业建设垂直领域的大模型。

银行与AI

2022年11月,ChatGPT横空出世,各大银行迅速跟进。比如中国建设银行启动“方舟计划”,推进金融大模型建设工程;中国工商银行率先建成了全栈自主可控的千亿级参数规模AI大模型技术体系。

从全球竞争看,国内多家金融机构在大模型方面已夺得先机。根据《麻省理工科技评论》发布的全球金融机构大模型领域专利创新排行榜,在全球金融机构大模型专利创新领域,中国申请量达1909件,占比超75%。从专利申请量看,有12家国内金融机构进入全球TOP20。

在俞吴杰看来,AI与银行业适配性非常强。其称,银行有三个重要的“密集型”特征。 一是数据密集,包括客户数据、行业数据、产业数据等;二是知识密集,包含大量的政策、法规、条款、合规等;三是人力密集,银行需要开展大量的运营工作,无论是网点还是后台的审核,都需要大量的人力。在这些方面,大语言模型能够产生的价值面非常广。

俞吴杰指出,大语言模型在银行业的应用是全方位的。比如在营销方面,可以借助大语言模型直接生成营销文案,并由专人审核,确保内容正确合规;服务质检方面,过去人工 *** 接听 *** 、记录内容、整理归类的流程可能需要五分钟,但现在可以借助语音识别转换成文本后交给大模型处理,可以把流程缩短到“秒”级,大幅提升工作效率;风控方面,招行的“天秤”风控平台可以通过大量的神经 *** 算法,将客户的正常行为和风险行为区分,保障客户资金安全......

而在大模型的开发应用过程中,小模型的使用价值也并未褪色。

俞吴杰认为,大模型的覆盖范围会越来越广泛,因为它可复用,边际成本会变低;而小模型需要专门的开发,专门的部署,专门的维护,成本会高,但两者一定会长期并存。“因为小模型有很好的解释性与针对性,比如客户的信贷额度评测,这需要很精准的数字要求,通常小模型的表现会更好,我们会持续用下去。”

如今在银行业,AI+趋势已然明确,各大中小银行应如何入局?

俞吴杰认为,从行业角度看,大语言模型是一项持续的、规模大的投资,包括建集群、 *** 人才等,且资源都比较稀缺,并非所有银行都适合大规模投入其中。银行业之间的交流非常多,中小银行机构可以复用一些业内经验。“不建议盲目跟风,尤其是一次性的大投入,目前大模型的发展还有很多变数,包括通用大模型哪个更优,怎么部署等,都还在变化过程当中。建议中小银行机构更多地做好行业交流学习,针对自身实际情况量力而为才是更合适的。”

通用与专业

2017年,招商银行成立了AI实验室,彼时的研究范围主要是语音、语言、计算机视觉技术等。生成式AI浪潮袭来,招行于2024年年初建立了智算平台。后续,招行将持续提升推理集群和训练集群算力效能。

俞吴杰尤其强调算力的重要性。“算力对于未来的大模型应用是刚性需求,没有算力服务,场景很难扩展,体验提升也有限。推理需要时间,你问它一个问题,它需要多久给你答案,这个是由算力决定的,算力必须持续增加。”

针对训练模型集群的扩大,俞吴杰称,招商银行不会在通用大语言模型上花费更多精力,因为通用大语言模型在银行业的运用有其弱点——对专业知识理解有限,在专业领域数据处理能力较弱。

囿于此,招行会在比较好的通用模型基础之上,将足够的专业领域知识给到大模型,“最起码是银行业,未来还可能扩展到证券、保险等与银行关联性大的行业”。

如何“喂料”是关键问题之一。“如今能从互联网获得的专业语料非常有限,更多的是招行几十年来经营积累的专业语料给到大模型,否则算力再强也没有实用性。”俞吴杰表示。

应用场景方面,俞吴杰认为,应用场景应选择“三多”场景,即资金投入多、人工投入多、耗时多的各类场景,“AI在这些场景产生的价值会更大”。截至2024年10月,招行的大语言模型应用场景已超百个。

为进一步延伸应用场景,招行将自上而下、自下而上地进行尝试。自上而下是做好规划,在零售、批发、中后台等领域探索应用空间;自下而上是了解一线需求,“最痛的点是什么,或者最能产生业务提效的点是什么,往往都是一线听得到炮火的员工理解得最深”。

值得一提的是,招行的FinTech基金为以上尝试提供了容错成本。“对于大语言模型的基础设施建设和应用,总行是全力支持,基本上都能通过FinTech基金走绿色通道。”俞吴杰谈及。

人与机

技术总有缺陷,大语言模型亦不例外。

“风险之一是大模型幻觉,这对银行的应用非常不利。”俞吴杰强调。针对此,招行给出了两个解决办法,一是保留人工审核,二是应用检索增强生成技术,让大模型对接外挂知识库。

“另外一个困难是资源消耗非常大。”俞吴杰称,若性能没有调优,等待时间很长,会影响客户体验。因此需要不断扩大算力,提高性能。

“数据隐私也是一个比较大的考量因素,尤其在训练环节里,一定不能使用客户敏感信息。”俞吴杰表示,如果数据管理不够严格,大语言模型可能会泄露隐私,因此招行在数据训练的准备上非常谨慎。

“最后,大语言模型对于答案生成的可解释性比较弱,你给他一个输入,他会给你一个输出,但为什么是这个输出呢?”俞吴杰举例称,比如做贷款发放审批的时候,为什么机器审核结果有的是同意,有的是不同意?

在俞吴杰看来,大语言模型的神经 *** 逻辑是一个“黑盒子”,在某些决策场景可能并不适用,这也意味着,大语言模型对场景是有选择和要求的。

因此,为优化客户体验,目前招行推行的是“人+数字化”的协同模式。俞吴杰认为,单独由人来解决,有温度但成本很高,解决不了规模效应问题;单独由机器来解决,效率很高,但可能给部分客户带来糟糕的体验。

“对招行而言,更重要的是怎么把两者结合好。在产生规模效应、提高效率的同时,也能提升客户满意度,人机结合将是我们未来很重要的客户服务形式。”