出品 | 搜狐科技
作者 | 梁昌均
7月5日消息,商汤在世界人工智能大会期间发布日日新5.5大模型,号称对标GPT-4 Turbo,并在多项性能评测中超越GPT-4o。
商汤CEO徐立介绍,日日新5.5采用混合端云协同专家架构,更大限度发挥云边端协同,降低推理成本,模型训练基于超过10TB tokens高质量训练数据,包括大量合成的思维链数据,提升推理思维能力。
具体来看,日日新5.5相较两个月前发布的5.0版本,在数学推理、英文能力、指令跟随、以及多模态等方面的能力均有明显提升。
根据现场公布的9项能力评测,日日新5.5在6项指标上超过GPT-4o。徐立还表示,基于日日新5.5打造的日日新5o的交互体验对标GPT-4o,通过整合跨模态信息,基于声音、文本、图像和视频等多种形式,带来一种全新的AI交互模式,即实时的流式多模态交互。
现场演示显示,日日新5o在和工作人员打招呼时,它能识别出其脖子佩戴的胸卡带子上的字眼,判断出现场就是世界人工智能大会会场,并俏皮说到“在这个地方可以好好学习”。
对于小狗玩偶,日日新5o能准确描述小狗的外貌、表情及穿戴的白帽子,并能识别出帽子上的字体。翻开一本以旅游主题的书的任何一页,日日新5o都能识别出文字,并能够对内容进行总结介绍。
工作人员现场还随手画了一只简笔小兔子和微笑表情,日日新5o直呼画得可爱,并解读微笑表情的内容,还能识别到添加了吐舌头的内容,称感觉这个“很开心”。
此外,徐立现场还宣布,为了让更多企业用户低门槛接入并使用“日日新”大模型体系的强大能力,商汤推出“大模型0元Go”计划,同时宣布商量端侧大模型每台设备价格为9.9元/年,推进大模型在端侧落地。
徐立认为,现在已经到了迎接AI 2.0应用的超级时刻,而应用是决定这个时代是不是人工智能超级时刻的一个关键。
“超级时刻和应用互相成就,只有超级时刻带来的认知的变化,最后才能推动这样一个应用。所以倒推回来,如果我们后面用应用来支撑,那么我们现在这个时刻就是超级时刻,就像iPhone一样。”徐立表示。
徐立认为,AI走向应用,要有几个核心重要的突破点。一是对高阶的逻辑数据的依赖性,来解决人工智能的推理问题,就是它的智慧。这其中合成的人工数据,特别是高级思维的数据非常重要。
第二个是实时的交互性能够带来一个流畅的体验,端侧则是一个非常重要的突破点,通过推动模型的端侧优化,实现实时交互更加流畅。”用好端和云两部分的计算机资源,才能够成为一种全自然的交互模式。”
最后很重要的是可控性,否则AI能够带来的效能提升就非常有限。“所有的生成都要可控,你不需要做得很好,但你需要知道哪里做得不好,并且说哪里需要进行一些修改,有了这样的一个边界,才能做到真正的可控技术以及可持续的技术发展。”
徐立现场还透露,商汤接下来会推出名为Vimi的可控人物类视频生成模型,其可以通过一张照片以及有各种不同的人物的姿势,最后用单张的照片生产出人物的视频。
不过,他认为,Sora带来的AI文生视频还没有到超级时刻,因为它没有真正走进到一个行业的垂直应用,并在当中引起广泛的变化。
发表评论
2024-09-11 06:35:10回复
2024-09-11 06:38:24回复
2024-09-11 06:41:37回复
2024-09-13 01:20:05回复
2024-09-13 01:24:29回复
2024-09-13 01:28:14回复