AI 科技评论独家获悉,字节跳动正在秘密筹备成立大模型研究院,并积极招揽人才。
知情人士称,已有外部 AI 大牛加入大模型研究院。但另一知情人士表示,字节有加强大模型相关研究的长期计划,但并未决定建立独立的机构。
此外,原序智科技创始人秦禹嘉、原零一万物核心成员黄文灏已加入字节,后者负责技术项目管理和规划,汇报给朱文佳。
从去年开始,字节才陆续对外公布关于大模型的相关工作进展。2023 年 8 月,字节自研的底层大模型「云雀」上线,随即推出 AI 对话产品「豆包」。
2023 年 11 月, Flow 在字节内部成立,专注于 AI 应用层面的研究和开发,由技术副总裁洪定坤和字节大模型团队负责人朱文佳主导该项目。
12 月底,除豆包之外的又一产品 Coze 在海外上线,其核心服务是为用户提供一个快速开发 AI 应用的平台,支持30秒无代码生成 AI Bot,并且集成了插件工具集,满足了个性化的使用需求。2024 年初,Coze 相应的国内版的产品“扣子”也正式上线,海外版和国内版整体产品形态和功能定位基本差不多,都是能够快速创建、调试和优化AI聊天机器人的应用程序。
过去,字节大模型团队的人才更多来自字节内部业务线,包括搜索、抖音、西瓜、TikTok 等,这与众多明星人才云集的大模型初创公司十分不同,很少出现从公司外部新招一号位的情况。
而今,大模型研究院的人才 *** 论则不同于以往,花费大手笔从外部招揽人才。
上周,零一万物联创黄文灏离职,加入字节。
黄文灏
黄文灏博士就读于北京大学计算机专业,读博期间恰遇 Deep Learning 兴起,于是 All in Deep Learning 研究,是国内最早做 Deep Learning 的一批人。
毕业之后,黄文灏加入微软亚洲研究院,做 Agent 相关研究,聚焦在可以完成任务的聊天机器人(Task Completion Chatbot)。之后,也做了 AI 技术落地的一些尝试,包括金融量化、AI for Science 等。
从微软亚洲研究院离职后,黄文灏来到智源研究院,担任健康计算研究中心技术负责人、创新应用实验室负责人,重点研究 AI for Life Science 方向 ,在基础层面上探索「AI+大健康」的研究课题、 *** 路径、外部合作以及人才储备等。其中,他的主要研究集中在两方面:一个是基于生物识别的自然语言处理研究;另一个是探索自然语言处理 *** 与结构研究的有机结合。
随后,他以联创的身份加入零一万物,担任算法副总裁,负责零一万物大模型 Yi-Large,包括 Yi-34B 在内的多个开源模型的训练和发布,在 LMSYS,huggingface llm leaderboard 上取得成绩。
雷峰网(公众号:雷峰网)雷峰网雷峰网
发表评论
2024-09-02 19:37:07回复
2024-09-02 19:49:02回复
看来字节跳动在大模型领域的研究动作频频,从秘密筹备大模odel研究院到积极招揽人才和外部大牛加入可以看出其决心和野心不小!黄文灏博士的加盟无疑为字节注入了强大的AI实力和技术经验积累的背景支持其发展壮大步伐加快的同时期待看到更多的人才加入到这个充满活力和创新的环境中共同推动人工智能的发展进步。#加油科技界#