出品|搜狐科技

Anthropic再反击!发布Claude 3.5吊打GPT-4o,视觉、逻辑推理等方面表现更强

作者|郑松毅

OpenAI劲敌Anthropic开始还手了!

就在几小时前,Anthropic发布3.5系列之一个版本Claude 3.5 Sonnet。

从官方披露的测试数据来看,其在逻辑推理、编程、数学等方面中的表现性能均超越GPT-4o。

网友直言,“太卷了,现在AI竞争是要以周为单位了吗?”

从官方介绍来看,Claude 3.5全家桶仍会有3款系列模型,分别是“大杯”Claude 3.5 Opus、“中杯”Claude 3.5 Sonnet、及“小杯”Claude 3.5 Haiku。

先问世的“中杯”就这么强,后面的系列模型确实值得期待。官方表示,Claude 3.5 Opus和Claude 3.5 Haiku会在今年晚些时候发布。

话不多说,来看看Claude 3.5 Sonnet这次有哪些亮点。

除了上述提到的逻辑、数学方面,官方声称Claude 3.5 Sonnet是当前最前视觉模型,在标准视觉基准上超越了Claude 3 Opus。

不仅如此,其在视觉数学逻辑推理、科学图解分析、图表分析、文件视觉分析方面表现性能全部优于GPT-4o。

“重大改进对于需要视觉推理的任务最为明显,例如解释图表和图形,以及可以准确地从不完美的图像中转录文本,这是零售、物流和金融服务领域的核心功能需求。”

另外,为了方便用户和AI界面有更好的交互,让用户能在人机交谈的同一页面看到任务生成情况,Anthropic贴心地推出了Artifacts功能。

可以把该功能理解为动态工作区,当用户在用Claude生成代码,或在进行网页设计时,可以在对话右侧窗口实时查看Claude的创作情况。

介绍完功能特性,再来说说很多人关心的使用成本。

值得一提的是,与上代“大杯”模型Claude 3 Opus相比,这次的“中杯”Claude 3.5 Sonnet不仅研发成本低,其性能已是最强前辈的两倍。

官方介绍,该模型每百万输入Tokens收费3美元,每百万输出Tokens收费15美元,具有200K Tokens上下文窗口。

Anthropic表示,目标是每隔几个月就大幅改善智能、速度和成本之间的权衡曲线。除了开发下一代模型系列外,还正在开发新模式和功能,以支持更多企业用例。

谈及AI安全,Anthropic强调,“模型已经过严格安全测试,且会注重保护用户隐私。除非用户明确允许,否则不会使用用户提交的数据来训练我们的生成模型。到目前为止,还没有使用任何客户或用户提交的数据来训练我们的生成模型。”

创始人为OpenAI前成员,获谷歌、亚马逊投资

作为一家创立不久,却有能力和OpenAI正面“掰手腕”的AI企业,Anthropic的优势主要得益于人才的汇聚,以及外界巨头大佬的支持。

2021年,7位与OpenAI发展理解不合的技术人员出逃创立了Anthropic。

带头出走的是一对兄妹,Dario Amodei 和 Daniela Amodei,辞去OpenAI工作的原因是想建立一个安全性和可控性更高的的模型。

离职后,他们还带走了曾在 OpenAI 领导 GPT-3 模型的工程师Tom Brown。

Dario Amodei(左) 和 Daniela Amodei(右)

据悉,Dario Amodei 在 OpenAI 工作了四年半,最早是 AI 安全的团队负责人,随后升任研究主管、研究副总裁。Daniela Amodei 则在 OpenAI 工作了两年,离职前是 OpenAI 安全和政策副总裁。

Anthropic 创立之初,吸引了Skype联合创始人Jaan Tallinn领投,其他支持者包括Facebook和Asana联合创始人Dustin Moskovitz,和前谷歌首席执行官 Eric Schmidt。目标是在未来与OpenAI一较高下。

2023年,Anthropic这颗“金子”持续发光发热,迎来更多势力雄厚的投资者,其中包括谷歌、亚马逊等科技巨头的参与。

在众多投资者中,谷歌的介入一直引人关注。就在微软高调宣布向 OpenAI 投资 100 亿美元后不久,谷歌向 Anthropic 投资了约 3 亿美元,以换取该公司 10% 的股份。

谷歌如同微软对待OpenAI一样,不仅提供资金支持,还提供训练 AI 模型所需的计算资源,成为Anthropic的强力后援。

Anthropic也是不负众望,近年来多次用产品证明自己,向OpenAI不断施压。

从另一方面来看,AI“角斗场”中的激烈竞技,实际也是在推进技术的更新迭代,以催化出令人更为惊喜的创新应用。