AIGC宇宙 AIGC宇宙

OpenAI神秘狠人,花名Bob

Jay 发自 凹非寺. 量子位 | 公众号 QbitAI在OpenAI,有一个神秘人专门负责推理用的CUDA内核。 同事们管他叫Bob,人们会把他写的注意力内核亲切地称为Bob内核。

Jay 发自 凹非寺

量子位 | 公众号 QbitAI

在OpenAI,有一个神秘人专门负责推理用的CUDA内核。

同事们管他叫Bob,人们会把他写的注意力内核亲切地称为Bob内核

这个内核每天可能在数十万张GPU上被执行万亿次

要知道,这个环节对精度的要求非常高,如果出bug,需要回滚checkpoint重训,会浪费大量的算力资源。

有网友感叹:

全世界能写出高性能训练用CUDA内核的人,活着的不超过100个。

OpenAI神秘狠人,花名Bob

就是这么一个“地狱级难度”的东西,在OpenAI居然只靠Bob一个人

OpenAI前员工感叹,Bob轻轻松松在几分钟内修好了自己一周都没搞定的问题。

OpenAI神秘狠人,花名Bob

其他前员工也附议,表示OpenAI对Bob的依赖极高。

公司内部的Slack上专门有一个“Bob magic”表情包,用来来膜拜Bob——无人能不折服于他那“巫师”般的能力。

还有些员工打趣道:如果Bob心血来潮想出去度假一周,那整个公司可就要准备好面临生死存亡的终极阶段了

OpenAI神秘狠人,花名Bob

既然是这么重磅级的人物,怎么能逃过小扎的法眼呢?

坊间传言,小扎已经知道了这个消息,已经火急火燎地安排上了,Meta明天招聘会议的Top 1事项就是:“Bob到底是谁!”

OpenAI神秘狠人,花名Bob

听说扎总甚至还为此大动肝火(笑死)

“小扎买买买”换新季居然能错过这么一个大宝贝,不禁怀疑自己每年给亚历山大王开的1400万美金是不是打了水漂。

OpenAI神秘狠人,花名Bob

Bob啊Bob,隐姓埋名这么多年,看来此次还是难逃小扎的魔爪。

OpenAI神秘狠人,花名Bob

像CUDA内核这种基础工程对AI公司来说实在太重要了,因此这类技术人员在硅谷往往被视为核心机密,Bob本人大概率是不会亲口承认的。

但在帖子评论区,反复地在出现一个名字——Scott Gray

OpenAI神秘狠人,花名Bob

Scott Gray毕业于美国伊利诺伊大学香槟分校,修读物理和计算机科学。

OpenAI神秘狠人,花名Bob

Scott是OpenAI相当资深的技术人员,他早在2016年就加入了团队,主要工作是负责GPU内核优化。

至今,Scott一共参与写作了51篇机器学习论文,总引用超过 80000 次。其中不乏像《GPT-4 Technical Report》《Scaling Laws for Neural Language Models》这样的重磅研究。

OpenAI神秘狠人,花名Bob

为什么说Scott的神秘人Bob的第一候选人呢?从Scott的技术背景和社交媒体上或许可以发现一些蛛丝马迹。

2017 年,Scott作为一作发布了《Block-sparse GPU kernels》,这是OpenAI官方博客上的一篇核心论文,由他与Alec Radford和Durk Kingma合著。

OpenAI神秘狠人,花名Bob

这是一种针对块稀疏权重(block-sparse weights)设计的高性能GPU内核。相比传统的cuBLAS或cuSPARSE,这种内核优化了全连接和卷积层,在某些稀疏度设置下可提速数倍

这与“Bob内核”描述的核心——高效注意力机制和海量GPU推理——高度吻合。

如果这还不够,让我们来看看Scott本人在“口供”里是怎么交代的。

2017年,Scott在Reddit上事无巨细地全盘托出了自己是怎么在OpenAI搭建的CUDA内核,包括FP16/FP32计算优化和针对P100/P102 GPU的适配。

OpenAI神秘狠人,花名Bob

Scott提到:“这些内核是我两个月前完成的,现在悄悄发布了。”

OpenAI神秘狠人,花名Bob

有人说,AI的未来取决于谁囤得下更多显卡。

但在硅谷,围绕人才的竞争才是如今台前最受关注、热议的焦点。

狙击战发展现在,只要有厉害的大佬出现在聚光灯之下,几乎是露头就秒,以至于各大实验室恨不得把手上的王牌全部挖个洞藏起来。

OpenAI这位GPU蒙面超人面纱被揭,亦是硅谷人才市场暗流涌动的一处具象化。

不知道小扎的超级智能实验室,是否又蓄势待发了呢?

此前,OpenAI的核心研究员几乎被小扎挖个半空,先后已有赵晟佳、Lucas Beyer、Alexander Kolesnikov等人纷纷跳槽加入Meta,可谓是连续给了奥特曼几记重拳。

OpenAI神秘狠人,花名Bob

图片由AI生成

那么奥特曼,这一次,你能够守得住Bob吗?

参考链接: [1]https://x.com/khoomeik/status/1968136500807340291 [2]https://openai.com/index/block-sparse-gpu-kernels/ [3]https://www.linkedin.com/in/scott-gray-569704/ [4]https://www.reddit.com/r/MachineLearning/comments/5izkux/comment/dbctqo3/?context=3

相关资讯

OpenAI o3 模型运行成本估算大幅上调:单次任务从 3000 美元涨至 3 万美元

Arc Prize Foundation 大幅上调 OpenAI o3 模型运行成本估算,从 3000 美元涨至 3 万美元。高昂成本凸显 AI 模型特定任务的高成本难题,控制成本成行业挑战。##AI模型成本##
4/3/2025 7:59:45 AM
远洋

o1 研发团队完整采访:Ilya早期曾参与,灵感源于AlphaGo

自从 OpenAI 的 o1 问世以来,它强大的推理能力就承包了 AI 圈近期的热搜。不需要专门训练,它就能直接拿下数学奥赛金牌,甚至可以在博士级别的科学问答环节上超越人类专家。展示 o1 实力的 demo,我们看了不少,评估 o1 表现的评测,全网比比皆是,关于 o1 技术路线的讨论也如火如荼,引发了广泛的关注和深入的思考。不过 o1 背后的故事,还鲜为人知,那些在幕后默默付出的团队成员们,他们的故事同样值得被讲述和铭记。刚刚,OpenAI 发布了 o1 研发团队的完整访谈,为我们揭秘了 o1 的「成长历程」。o
9/22/2024 1:27:00 PM
机器之心

LeCun批评o1根本不像研究,Noam Brown回怼:已发表的研究都是废话

图灵奖三巨头之一 Yann LeCun 又和别人吵起来了,这次是 Noam Brown。Noam Brown 为 OpenAI o1 模型的核心贡献者之一,此前他是 Meta FAIR 的一员,主导了曾火遍一时的 CICERO 项目,在 2023 年 6 月加入 OpenAI  。这次吵架的内容就是围绕 o1 展开的。众所周知,从 AI 步入新的阶段以来,OpenAI 一直选择了闭源,o1 的发布也不例外。这也引来了广大网友的吐槽,干脆叫 CloseAI 算了,反观 Meta,在开源领域就做的很好,o1 的发布,更
9/30/2024 2:12:00 PM
机器之心
  • 1