年初以来,关于大模型落地应用的呼声愈发高涨,越来越多的目光开始瞄向行业大模型。
在这一叙事体系下,大多数企业思考的核心问题开始变成大模型能够给企业带来什么,企业又该如何将自身业务更好地与 AI 技术做结合。
但,「拿着锤子找钉子」真的是这一波 AI 浪潮中行业大模型落地的正确姿势吗?
第四范式联合创始人兼总裁胡时伟告诉雷峰网(公众号:雷峰网),在与企业沟通时,相较于企业追问 AI 能够给自己带来什么,他更倾向于让企业思考自身最想要的是什么。
「你要思考企业面临的核心问题是什么?再思考能用大模型创造什么样的价值?」
技术发展的本质是解放生产力、解决实际问题。相较于「拿着锤子找钉子」式地在企业经营管理的「长链条」边缘侧敲敲打打,那些关于自身「生存」与「扩张」的根本问题,才应该是企业在谈论行业大模型时的核心思考。
大模型落地的关键:从企业顶层战略介入,提升核心竞争力
某餐饮连锁集团是国内餐饮连锁翘楚之一,在全国拥有近 13000 家门店,覆盖 1700 多个城镇,发展势如破竹的同时面临着竞争对手的步步紧逼。
在与第四范式以往的合作中,该集团曾要求 *** 一款 AI *** 产品,投入使用后效果很好,省下了几百万元的 *** 费用。但第四范式与该客户的后续交流中,反复引导客户思考,用 AI 仅帮自己节省几百万的 *** 费用,能不能提升企业的核心竞争力?真正决定和竞争对手拉开差距的企业核心竞争力究竟是什么?
是坪效。
集团当时的线上化转型困难重重,仅仅把销售渠道搬运到线上,却不把消费者在线下门店获取的有温度的、个性化的体验带到线上,线上化转型不可能成功。了解到客户的核心痛点之后,第四范式用行业大模型为该集团重塑线上系统,将坪效锁定为线上化转型的北极星指标,用 AI 技术不断改善用户体验,提供专属服务,真正做到千人千面,千店千面,最终成功转型。截至 2023 年,该集团核心业务 89% 的订单,来自于线上。
第四范式作为一家从成立起就定位为用 AI 技术帮助客户实现数字化转型的企业,在十多年的实战中得出了经验——技术越是狂热,越是需要冷思考大模型落地的关键是什么,或者说,行业大模型的真正价值是什么。
其实,面对 AI 大模型强大能力的兴奋和自己无法融入时的无措,是大多数企业的缩影。
今年年初开始,经过去年持续一年多的「百模大战」,国内通用大模型市场走向收缩,加速大模型在各大场景中的落地应用成为主旋律,专业性更强、性能更优的行业大模型逐渐兴起。千行百业的企业开始兴奋,早早伸开双臂,呼唤大模型的到来。
数据显示,2025 年全球生成式 AI 市场规模将达到 100 亿美元以上。其中,企业级生成式 AI 市场将占据相当大的份额,成为更大的应用领域之一。
然而理论很美好,可在具体行业、具体企业的实际推进上,效果并不明显。
一些大模型从业者向雷峰网反映,在与企业接触的时候往往发现,他们一边期待可以早点拥抱大模型,快速应用,另一边却又不懂技术,茫然无措,不知该在业务的哪个环节应用大模型,以及该如何应用,「企业里面缺少真正从业务到 AI 连接的人员。」
而对于大模型从业者来说,不像企业那样深度了解各个业务环节的运行,无法精准摸清最需要大模型的是哪一环节。
就这样,双方就卡在这一「鸿沟」上相持不下,最初的热情也在一次次不那么美好的实践效果中冷却,大模型难以真正在场景中落地应用。
但胡时伟告诉雷峰网,其实没那么难,关键在于要弄清楚大模型落地的本质,是作为一种工具来实现企业的最核心诉求——解决核心问题,提升核心竞争力。
第四范式联合创始人兼总裁胡时伟
「行业大模型的真正价值,在于为企业解决核心业务痛点的场景大模型 *** ,这些行业大模型将成为 AI +千行百业的新型基础设施。」胡时伟说道。
而围绕这一实际诉求,行业大模型在落地应用过程中需要解决的三大核心问题也变得清晰起来。
一是价值,即明确 AI 或者说行业大模型要解决的行业核心问题是什么,这是根本,不同的行业场景有不同的核心问题。比如,零售行业场景的核心问题是如何做好供应链;医疗健康管理场景的核心问题是怎么做好诊断和预防;金融风险管理场景的核心问题是如何实施风控。
二是数据,大模型需要训练,没有数据就没法训练。企业一般觉得这不是问题,自身的数据仓库里存放着大量的数据,但是他们没有意识到那些数据根本不是解决这个问题所需要的数据。甚至可以说,如今大量企业能够有效用到的数据不到其整体的 5%。
对于行业大模型而言,不仅需要通用语料库,还需要针对具体行业、具体场景的专业语料库,这意味着需要对各业务产生的数据进行处理、标注,才能得到可以用于大模型训练的有效数据,「真正优质的数据由人与人之间的互动过程产生」,而不是任意、随机生成的数据。
三是模型,模型是需要迭代的,这意味着即便有现成的模型也不能拿过来直接用,也要针对企业自身的场景、问题,一轮一轮迭代、调试,解决一个又一个具体的问题。
「只要把这三大核心问题解决了,那么算力、行业 Know how 等影响行业大模型落地的问题就都不是问题了。」
可对于企业来说,知道了什么是有价值的、所在行业的核心问题是什么、训练大模型需要怎样的数据,就能选择出适合的大模型,来加速自身的数字化转型吗?
显然,这并不是一件容易的事情。
比如,零售行业、医疗行业、金融行业场景的一些核心问题分别是如何做好供应链、做好诊断和预防、实施风控,而相对应的数据模态依次是监测数据、体检报告、风险评估报告等,这些都不是语言,如果仅仅把这些行业知识灌输到大语言模型中,也只能做到「隔靴搔痒」,根本无法解决核心问题,实现企业的本质诉求。
那怎么办?
第四范式十年的行业大模型实践心得:降低应用门槛,做有价值的AI
今年 3 月,第四范式发布先知 AIOS 5.0行业大模型平台,基于各行业场景的 X 模态数据,构建行业基座大模型,以解决当前行业大模型只能将行业文本数据「喂」给大语言模型、生成下一个 token 的问题,从而促进大模型在更为广泛的场景中落地应用。
怎么理解?
我们都知道,当前以 OpenAI 的 GPT 为主流的大模型本质是预测下一个 Token,即 Predict the next X 中的 X 指的是大语言模型中的文本。那么,面对当前不同行业场景的核心诉求,能不能试着将 X 的内涵延伸到不同的模态数据?
答案是可以的,第四范式此次所推出的行业大模型平台「先知 AIOS 5.0」就进一步升级了预测下一个 X 的能力。对于不同行业场景的企业来说,只要在平台上传其核心模态数据,就可以训练出符合其需求的行业大模型,大大降低了训练门槛,不再让应用大模型遥不可及。
这是第四范式作为一名行业「老兵」,在过去十多年的实战中获得的经验。
其实,如果仔细看,抛开 Transformer、GPT 的定义才算大模型,从解决实际问题的角度出发,第四范式做行业大模型的时间线由来已久。2014年第四范式成立,是国内最早思考「通用智能」的 AI 公司——提出做AutoML,本质是为了减轻 AI 项目定制化中机器学习工程师的工作量。
胡时伟告诉雷峰网,第四范式成立的目的主要就是想把机器学习这件事情给应用到解决行业实际问题中。
而第四范式创始人兼 CEO 戴文渊也多次公开表示,「从十年前创业之一天开始,第四范式做的就是行业大模型。」
其实我们也可以从先知 AIOS 平台的每一次迭代中窥探到这一点。从 1.0 到 5.0,十年间,先知 AIOS 历经 5 次升级,而每一次的技术迭代,都是针对彼时企业在应用 AI 时的痛点问题,围绕着降低门槛、提升开发效率的诉求,一步步推进,做有价值的 AI,一如第四范式从之一天起就明确的价值观——AI for everyone。
2014 年 12 月,先知 AIOS 1.0 首次推出,据胡时伟介绍,当时企业自称有业务、有数据,只差算法,于是就先做机器学习算法,通过高维、实时、自学习框架大幅提升模型精度。但之后发现,对于企业来说,生产系统、基础设施并不像想象的那么完备,无法解决深度学习的新架构问题,于是,第四范式开始推进先知 AIOS 2.0。
2017 年先知 AIOS 2.0 发布,它解决的是基础架构等问题,可利用自动建模工具 HyperCycle,大幅降低模型的开发门槛,开始真正在企业中发挥实质价值、落地生产应用。
紧接着,第四范式发现,虽然企业有大量的数据,但那些都是用来做数仓的数据,没有标注,缺乏真正用来培养机器智能的数据。于是,第四范式开始加快先知 AIOS 3.0 的研发步伐,希望把数据这一问题快点解决。
之后,等到 2020 年发布的先知 AIOS 3.0 平台,规范了 AI 数据治理和上线投产,完成了从模型构建到落地应用的「最后一公里」。
而等到先知 AIOS 4.0 的研发阶段时,第四范式开始琢磨企业还有哪些问题没有解决,后来发现,企业不知道该拿先知平台来做什么,虽然能在场景中使用,但发挥的价值不高。
于是,沿着为企业创造更高价值的目标,2022 年第四范式发布的先知 AIOS 4.0 ,引入了北极星指标,添加了管理层面的能力,更大化发挥 AI 的应用价值,以提升企业核心竞争力。
之后,就是今年 3 月推出的先知 AIOS 5.0,提供了各类开发工具以及企业级模型纳管平台,业务人员可通过自然语言交互(企业级AI Agent)的方式,实现行业大模型的构建、优化、报告、管理全流程。
据第四范式 2024 年之一季度财报数据显示,前三个月,第四范式实现营收 8.28 亿元,同比增长 28.5%。其中,先知平台收入 5 亿元,在总收入中的占比高达 60.6%,已然成为第四范式的核心业务。
目前,以先知 AI 平台为核心,以及 SHIFT 智能解决方案、第四范式式说AIGS服务,共同组成第四范式的三大主要业务板块。
SHIFT 智能解决方案是基于第四范式底层 AI 能力,以及和生态伙伴的行业实践经验,沉淀出各行各业的智能解决方案产品。
AIGS 平台,即「以生成式 AI 重构企业软件」,在今年 4 月第四范式发布「式说3.0」大模型时正式提出,这是基于「式说」大模型能力打造的生成式 AI 软件开发平台,也可视为第四范式在大模型商业化方向的开拓。
「这三者形成一个闭环,不断迭代,不停解决具体问题,为企业创造价值,提升核心竞争力。」胡时伟说道。
「量变」到「质变」,第四范式独有的纵向 AGI 路线图
当行业大模型解决了企业的核心问题,提升了核心竞争力之后,或将加速企业的数字化转型步伐,带来企业的核心竞争力产生由「量变」到「质变」的巨大变革,加速企业朝着「下一代企业」迈进。
怎么理解?
在胡时伟看来,随着外部环境的竞争加大,面对剧增的的经营压力,很多企业试图寻求通过数字化转型来改变这一困境。
而相较于传统的「金字塔型管理体系」,企业可以试着面向核心竞争力建设基于数字化技术的经营管理体系,按照战略数字化、策略数字化、执行数字化和评价数字化的四大维度推进,打造闭环的数字化迭代体系,推动企业核心竞争力从「量变」到「质变」,率先成为「下一代企业」。
在过去的几年里,第四范式主要聚集在使用 AI 帮企业解决从战略到策略数字化的推进,而大模型的出现,加速了策略数字化向执行数字化的演进,企业数字化转型的步伐大大提升。
比如,上文提到的某餐饮连锁集团,在明确了自身的核心诉求后,第四范式以个性化点餐系统为切入点,为客户量身打造了个性化的精准推荐服务,不断优化客户体验,提升客单价及整体销售额。另外,第四范式还为其构建了 AI 平台,让 AI 能够以平台化、高效能的方式落地从线上到线下、从营销到营运的关键业务场景。
结果就是,该集团的平均客单价提升了 2%,全年销售额增长数亿元。
其实,不仅是在企业的数字化转型上,推动企业核心竞争力从「量变」到「质变」,率先成为「下一代企业」,在通往 AGI 的道路上,第四范式也在走着一条独特的从「量变」到「质变」的路径。
当前,关于 AGI 的定义和道路问题,业界根本无法达成共识,各路人马争吵不休,纷纷为自己的信仰正名。
而胡时伟更喜欢务实,想要在热闹中,从扎根做 ToB 的实用主义角度出发,抓住这一波浪潮中 AI 价值的「波峰」。
他认为,AGI 并非新事物,从 2016 年的 AlphaGo,往前,上世纪 90 年代的深蓝,再往前甚至是上世纪 50 年代 AI 刚兴起时,人们就开始谈论「 AI 替代人类」「 AI 消灭人类」等话题,其实都属于 AGI 的范畴,几乎每隔二三十年都会重新「热」起来,然后再「落」下去,呈现「波峰波谷」式发展。
但同时还有另外一条发展曲线,那就是 AI 价值,一直是稳固上扬式前进。而到这一波,「AI 价值已经达到了顶峰,政策、资本、企业、公众全部参与进来,相较于上一波甚至整个 AI 的发展历史来看,都是更高点。」因此,要抓住机会,更大化发挥 AI 价值,做好行业大模型。
而当行业大模型汇聚成海时,或许就是通往 AGI 之日。
胡时伟认为,如果我们能够因地制宜,结合中国市场特点,一个接一个地把每个行业、场景所需要的行业大模型做到极致,那么就可以由点到线再到面地往前推进,而随着覆盖面越来越密集,最终就可以汇聚成海,从「量变」到「质变」,最终实现 AGI。
这就是第四范式所坚持的、不同于以 OpenAI 为代表的技术信仰派的纵向 AGI 路线。
「我国有完善的产业链,有场景,有数据,有行业进行数字化转型升级的需求」,而这正是我国区别于国外发展大模型的战略优势,或许也是即便在技术上居于劣势,也能实现弯道超车的机会,胡时伟说道。
据了解,目前第四范式的行业大模型业务已在金融、制造、医疗、零售、教育、能源、地产经纪等领域落地,距离汇聚成海时,未来可期。
发表评论