AIGC宇宙 AIGC宇宙

陶哲轩

先别急着给OpenAI加冕!陶哲轩:这种「金牌」,含金量取决于「赛制」

昨天,OpenAI 官宣了一个重磅消息:他们的一个推理模型在国际数学奥林匹克(IMO)竞赛中获得了金牌水平的表现。 官宣该消息的 OpenAI 研究科学家 Alexander Wei 表示,在评估过程中,研究团队严格按照人类选手的比赛规则进行测试:模型需要在两个 4.5 小时的考试环节中,在没有任何工具或网络辅助的情况下,阅读官方题目并撰写自然语言证明。 在评估中,该模型成功解决了 2025 年 IMO 六道题目中的五道,获得了 35 分(满分 42 分)的成绩,足以获得金牌。
7/20/2025 3:09:00 PM
机器之心

陶哲轩提前实测满血版 OpenAI o1:能当研究生使唤

原来早在 8 月份,陶哲轩就已经用上了 OpenAI o1。还是现在大家都用不上的满血版本(眼泪不争气地从嘴角流出来)。提前批大佬是怎么玩最新天花板的呢?他向 o1 模型提出一个措辞模糊的数学问题,发现它竟然能成功识别出克莱姆定理。而且答案是“完全令人满意的”那种。当然,陶哲轩还做了一些其它测试,测下来总体体验就是:比以前的模型更牛,多堆点提示词表现还不错,但仍然会犯不小的错误,也没有产生啥自己的思想。陶哲轩是这样形容的:这种感觉,就像给一个平庸无奇但又有点小能力的研究生提供建议。不过,这已经比以前的模型有所改进,
9/16/2024 6:51:12 PM
清源

陶哲轩:初学者不宜用AI工具做专家级任务,GPT对专家帮助不大

对于不同技能水平的人,使用 GPT 等 AI 工具收获的成效也大不一样。
9/11/2023 7:24:00 AM
机器之心

陶哲轩用大模型辅助解决数学问题:生成代码、编辑LaTeX公式都很好用

数学研究工具可以随 AI 模型的进展更新一波了。
9/5/2023 6:42:00 PM
机器之心
  • 1