出品 | 搜狐科技
作者 | 王一鸣
编辑 | 杨锦
自从去年OpenAI CEO山姆奥特曼被自己公司开除,OpenAI高层的博弈就没有停歇过。
8月6日周一,OpenAI 联合创始人John Schulman(约翰·舒尔曼)在X表示,他将离开微软的OpenAI,加入了隔壁亚马逊Anthropic的Claude团队。
John Schulman曾担任OpenAI后期训练(预训练的二阶段)团队的负责人,同时也是ChatGPT的架构师,他们的团队曾经负责完善ChatGPT的AI模型和第三方开发者的编程接口。今年6月,OpenAI表示,Schulman将作为对齐研究科学负责人加入安全委员会,可向董事会提供建议。
对于John Schulman来说,这是一个艰难的决定,他表示:“这个选择源于我希望深入研究AI领域,并开启新的职业生涯,重返实际技术工作。”
Schulman在2016年获得了加州大学伯克利分校计算机科学博士学位,Pieter Abbeel是他的师傅,研究方向是机器人技术和强化学习,自从毕业以来就一直在 OpenAI 工作。
近端策略优化(PPO)是一种深度强化学习算法,这篇论文是他的代表作。
深耕强化学习算法的他领导了OpenAI 的强化训练组织(reinforcement training org),对生成式ChatGPT模型进行微调,从而遵循人类的指令。
他还曾经获麻省理工评论奖:“35名35岁以下的先进创新先驱”。
此奖项与强化学习有关,文中讲到,OpenAI的研究科学家John Schulman塑造了机器学习分支强化学习中的许多关键算法。其实强化学习就是这么回事:训练AI的方式跟训练狗一样,给到你正确回应之后给它奖励。对于机器来说,“奖励”可能相当于是在游戏中拿MVP。
Schulman补充道自己离职并不是因为OpenAI在对齐研究方面投入不足,而是因为自己个人选择。
“相反,公司领导还一直挺重视这一方面的投资,”他说。
与此同时,OpenAI联合创始人Greg Brockman也表示要休假到年底,这一定是个巧合。
山姆奥特曼也对John Schulman做出了正式的回应,表达了对Schulman的感谢,并且称赞他是一名优秀的研究人员,对于产品和社会有着深刻的思考。OpenAI这里的所有人跟Schulman都是好朋友,所有人都会想念他。
他还表示,Schulman为OpenAI早期战略提供了非常有价值的信息。
OpenAI先前一共有11名创始人,随着Schulman的离开,如今只有3名,分别是OpenAI首席执行官Sam Altman、Brockman和语言和代码生成负责人Wojciech Zaremba。
OpenAI的对齐研究“天团”Jan Leike和联合创始人Ilya Sutskever都在今年离职了。Leike跟Schulman一样加入了Anrowpic,而Sutskever则成立了Safe Superintelligence,业务是关于人工智能安全。
同样在对齐研究团队工作的William Saunders、Ryan Lowe和Daniel Kokotajlo都离开了OpenAI。
Anthropic这家初创公司是Dario Amodei和Daniela Amodei这对兄妹在2021年初成立的,其实他们曾经也是OpenAI员工。自从Anthropic成立以来,他们一直在与亚马逊、谷歌和Meta角逐性能更好的生成式人工智能模型。
目前,OpenAI正面经历人事大变动,同样是OpenAI创始成员之一的Andrej Karpathy在2月离开了 OpenAI,在7月创办了一个AI集成教育平台。
其中人工智能安全负责人亚历山大·马德里 (Aleksander Madry) 早在7月时就被调任其他职位。
根据The Information,去年加入OpenAI的产品经理Peter Deng也已离职。
发表评论