AIGC宇宙 AIGC宇宙

天塌!OpenAI两位o系列大佬Jason Wei和Hyung Won Chung被曝离职,疑似发推回应:要超越老师,须强化自己

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)Meta 化身“人才收割机”的节奏简直停不下来。 此前从 OpenAI、谷歌花天价薪酬挖走了多达 8 位顶尖人才。 现在,那个让我们非常熟悉的、经常在直播宣发中出现的大佬,o 系列模型的两位核心研究人员 Jason Wei 和 Hyung Won Chung,也被 Meta 一道挖走了。

编辑 | 云昭

出品 | 51CTO技术栈(微信号:blog51cto)

天塌!OpenAI两位o系列大佬Jason Wei和Hyung Won Chung被曝离职,疑似发推回应:要超越老师,须强化自己

Meta 化身“人才收割机”的节奏简直停不下来。

此前从 OpenAI、谷歌花天价薪酬挖走了多达 8 位顶尖人才。现在,那个让我们非常熟悉的、经常在直播宣发中出现的大佬,o 系列模型的两位核心研究人员 Jason Wei 和 Hyung Won Chung,也被 Meta 一道挖走了。

刚刚有消息证实,这两位大佬的 Slack 账号已经被停用。

图片

多提一嘴,OpenAI 别看公司已经很大了,但内部还没有自己的邮箱,沟通全靠Slack 活着。

不过,至于下一站是否是 Meta,目前还没有看到大佬本人的回应。

图片

目前,小编发现, X 上 Jason 在两个小时前,连发两条长文,阐明自己对于强化学习的热爱。

图片

两篇推文中蕴含着浓浓的“人生总结”的味道。尤其上面那篇,“要想超越老师,必须走自己的路”,似乎在回应着这场突发的别离。

但当网友发出证实疑问:离职去 Meta,是真的吗?

Jason 并没有给出回应。

图片

另一位大佬 Hyung Won Chung 则在 2 小时前 X 上没有给出回应,只是转了一个斯坦福的讲座视频。

这个视频中的主角则是 Jason Wei 和  Hyung Won Chung,演讲内容则是有关缩放定律和惨痛教训的故事。 

这波回忆杀,似乎也在透露两人共同经历的美好时光。

图片

我是 RL死忠粉,但——要想超越老师,必须走自己的路,强化自己

成为过去一年里一位 RL(强化学习)死忠粉,并且大部分清醒时光都在思考 RL,无意中教会了我一个关于如何活好自己人生的重要课题

在 RL 中,一个核心概念就是:你总是希望“在策略上(on-policy)”进行学习。也就是说,不是去模仿别人的成功路径,而是根据你自己的行为,从环境中获得奖赏并学习。显然,模仿学习在初期帮助你获得非零通过率非常有用,但一旦你能走出“合理的路径”,我们通常就避免继续用模仿学习,因为最有效发挥模型自身独特优势的方式,就是只从它自己的行动轨迹中学习。一个被广泛接受的体现是:在训练语言模型解决数学题时,RL 方法优于简单地用人类写下的思路链做监督微调。

在人生中,情况也一样。我们最开始通过“模仿学习”自我启动(上学阶段),这是非常合理的。但即便毕业后,我依然有个惯性——研究别人的成功路径,然后去模仿。有时,这种方法会奏效,但我最终意识到——我永远无法超过那个榜样,因为他们做事时用的是我没有的优势。可能是:某个研究者自己搭建整个代码库,一下子就 yolo(随性尝试)跑通一堆实验,而我并没那能力;又或者是足球中的例子:某个球员用力量压制对手控球,而我却没有那力量。

“RL 在策略上学习”的课题告诉我:想要超越老师,必须走自己的路,承担风险,从环境中直接获取奖赏。比如,我有两个方面比普通研究者更享受:

  1. 阅读大量数据
  2. 做 ablation(消融实验),以理解系统中各组件的作用。

记得有次我在收集数据时,花了几天时间认真读每一条数据,并给每个标注员反馈,结果数据质量大幅提升,我对手头任务的理解也更深入。就在今年早些时候,我花了整整一个月,对之前“随性 yolo”的那些决策做了一次全面的消融实验。虽然时间成本不小,但正是这些实验让我对“哪种类型的 RL 更有效”有了独特洞见。更重要的是,这种追随自己兴趣的方式不仅让我更有成就感,也让我觉得自己正走在一条为自己和研究构建更强独特赛道的路径上。

总结一下:模仿当然有益,且起步必须。但当你启动得够稳健之后,想要胜过老师,就必须“on-policy”地强化自己,用你自己的优势拼出新高度 😊

好了,文章就到这里了,硅谷的人才流动氛围就是如此,小编非常期待生成式AI时代,多强争相引领风骚的局面,也祝愿每一位大佬得偿所愿,前程锦绣。

最后附上那场惊艳了小编的直播截图,权作一个阶段凌晨追踪报道的纪念吧!

天塌!OpenAI两位o系列大佬Jason Wei和Hyung Won Chung被曝离职,疑似发推回应:要超越老师,须强化自己

相关资讯

小扎挖走四名顶尖华人震惊Sam Altman,OpenAI最新内部全员信:奉陪到底,薪资大调整

昨天爆出小扎挖走OpenAI四名华人顶尖研发领导,果然是挖到了OpenAI的大动脉,震惊了整个OpenAI,现在Sam Altman 已经焦头烂额了,正在全力应对。 OpenAI的首席研究官Mark Chen刚刚向全体员工发送了一封措辞强硬的全员信,承诺将在顶级研究人才的争夺战中与小扎正面交锋。 Mark Chen在信中写道:“我现在有一种发自肺腑的感觉,就好像有人闯进了我们的家,偷走了我们的东西。
6/30/2025 8:55:13 AM

腾讯开启史上最大就业计划,三年新增 28000校招岗位,今年六成面向技术人才

4月17日,腾讯宣布启动史上最大就业计划,三年内将新增 28000个实习岗位并加大转化录用,其中仅 2025年,就将迎来 10000名校招实习生,有六成面向技术人才开放。 腾讯方面表示,今年开放的校招实习岗位涵盖技术、产品、设计、市场、职能等五大类70余种岗位,包括大模型、研发、算法、市场、策划、运营、销售、美术等多个岗位职能。 同时,在大模型加速落地的背景下,腾讯加大了人工智能、大数据、云计算、游戏引擎、数字内容等技术类岗位的招聘力度,技术类岗位“扩招”力度空前,占比超60%。
4/17/2025 6:17:00 PM
新闻助手

OpenAI联创Schulman闪电跳槽!从Anthropic转投Murati新公司

跑去隔壁Anthropic的OpenAI联创John Schulman,又又又跳槽了。 《财富》爆料,Schulman新的去向,是加入原OpenAI首席技术官Mira Murati的新创业公司。 此时距离他转投Anthropic,仅仅不到半年。
2/7/2025 10:13:16 AM
量子位
  • 1