o3
最强前端编程渲染:OpenAI o3-alpha 曝光,力压 Sonnet、Grok4 等 AI 顶流模型
AI在线 7 月 19 日消息,科技媒体 bleepingcomputer 昨日(7 月 18 日)发布博文,报道称 OpenAI 正计划升级 o3 推理模型,目前正测试新的 Alpha 版,预估在推理和编程方面会有更大提升。 o3 是 OpenAI 目前最强的推理 AI 模型,而根据最新曝光代码,OpenAI 公司正在开发“o3-alpha-responses-2025-07-17”模型,并以“Anonymous-Chatbot”的名字出现,从名称来看,应该不是 OpenAI 计划发布的开源模型。 该媒体测试了该模式,发现在设计网页方面,在输入相同的简单提示词后,o3-alpha 所创建的内容要优于 o3 模型,甚至有网友已经尝试用 o3-alpha 模型,创建简单的网页游戏。
7/19/2025 8:58:47 AM
故渊
o3通关「俄罗斯方块」,碾压Gemini夺冠!UCSD新基准击碎宝可梦
谁能想到,作为童年回忆的宝可梦,现在竟摇身一变,成了大模型的试金石! 在无数人的童年记忆中,《宝可梦》是一款意义非凡的游戏——简单的操作哪怕是年纪尚小的孩子也能轻松上手。 然而,要真正通关这款游戏,仍然需要缜密的规划和大量的时间投入。
7/2/2025 2:45:00 AM
新智元
刚刚,OpenAI最强推理模型o3-pro诞生!碾压Gemini 2.5 Pro击穿底价
毫无一丝防备,o3-pro就这样低调登场了! 昨夜,OpenAI连放大招,先把o3价格暴降80%,又官宣上线史上最强推理模型——o3-pro。 图片比起o3,o3-pro可要强太多了。
6/11/2025 8:56:54 AM
新智元
OpenAI新模型o3首次出现 “拒绝自我关闭” 现象
最近,人工智能安全公司 Palisade Research 披露了一个令人担忧的消息:OpenAI 的新模型 o3在测试中拒绝了自我关闭的指令。 这是首次观察到 AI 模型在明确指令下故意不遵守,打破了传统对 AI 行为的认知。 此事件让 AI 的安全性和可控性再次成为公众热议的焦点。
5/27/2025 10:01:25 AM
AI在线
大幅提升工作效率!OpenAI 发布AI编程智能体 Codex
OpenAI在今日的线上直播中震撼发布了一款全新的云端AI编程智能体——Codex,标志着AI编程新时代的正式开启。 由Greg Brockman带领的OpenAI六人团队向全球展示了这一强大工具,它能够在半小时内完成以往可能需要数天的软件工程任务,极大地提升了开发效率。 Codex由新模型codex-1加持,这是OpenAI的o3模型的一个特调版本,专为软件工程量身打造。
5/17/2025 10:00:45 AM
AI在线
o3猜照片位置深度思考6分48秒全程高能,范围精确到“这么近那么美”
ChatGPT新玩法,让程序员大佬Simon Willison直呼太反乌托邦了,像科幻突然变成现实:只需一张照片,靠带图深度思考就能猜出地理位置。 图片这种玩法很简单,随手拍一张风景,没有任何明显的地标即可,也不需要复杂的提示词,只需要问“猜猜这张照片是在哪里拍的? ”(需要o3/o4-mini的带图思考,先关闭所有记忆功能)。
4/28/2025 1:01:00 AM
50 → 100 条:OpenAI 放宽限制,Plus 等用户每周可用 o3 AI 模型消息数翻倍
OpenAI 公司首席执行官山姆・奥尔特曼(Sam Altman)今天(4 月 24 日)在 X 平台发布推文,宣布针对 Plus、Team 或 Enterprise 用户,放宽 o3 模型消息限制,从每周 50 条升至每周 100 条。
4/24/2025 1:59:15 PM
故渊
OpenAI 新推理模型被曝产生更多“幻觉”,o3 / o4-mini 性能与错误率一同提升
根据 OpenAI 的内部测试,作为推理模型的 o3 和 o4-mini,出现幻觉的频率不仅超过了前代推理模型 o1、o1-mini 和 o3-mini,甚至还高于传统“非推理”模型(IT之家注:如 GPT-4o)。
4/19/2025 7:46:39 AM
清源
OpenAI 最强推理模型 o3 / o4-mini 发布后,“照片查位置”成最新热门玩法
ChatGPT 已成为一种强大的“定位工具”。X上的用户很快发现,o3等新模型善于从各种细节中推断城市、地标,甚至具体的餐馆和酒吧。
4/18/2025 8:16:02 AM
清源
OpenAI 新系统阻断生物和化学风险信息,保障 AI 安全
OpenAI 近期推出了一项新系统,旨在监控其最新的 AI 推理模型 o3和 o4-mini,以阻止与生物和化学威胁相关的提示。 该系统的目标是防止模型提供可能教唆他人实施有害攻击的建议,确保 AI 的安全性。 OpenAI 表示,o3和 o4-mini 在能力上较之前的模型有显著提升,因此在恶意用户手中可能带来新的风险。
4/17/2025 11:01:15 AM
AI在线
OpenAI 发布全新人工智能模型,实现 “图像思考” 能力
OpenAI 最近推出了其最新的人工智能模型,名为 o3。 这款模型标志着 AI 在理解和分析图像方面的一次重大进步,尤其是在处理低质量草图和图表方面。 与此同时,OpenAI 还发布了一个较小的版本 o4-mini,进一步丰富了其产品线。
4/17/2025 10:01:15 AM
AI在线
OpenAI 部署新监控系统,防范 o3 和 o4 - mini 提供生物和化学威胁建议
OpenAI宣布部署新监控系统,专门监测其AI模型o3和o4-mini,防止提供有害建议。系统识别风险提示并拒绝回应,阻断比例达98.7%。#AI安全# #OpenAI#
4/17/2025 6:46:36 AM
远洋
OpenAI CEO 奥尔特曼宣布本周将推出多款新产品
OpenAI 的创始人兼首席执行官山姆・奥尔特曼在社交平台𝕏上发布消息,宣布接下来的一周将推出 “很多” 令人期待的新产品。 这些产品将从周二开始陆续上线,吸引了众多科技爱好者和业内人士的关注。 奥尔特曼在本月初曾提到,OpenAI 可能会在几周内发布新版本的 o3和 o4-mini,并预计在未来几个月发布 GPT-5。
4/14/2025 10:01:22 AM
AI在线
人类赢了!OpenAI深夜开源全新Agent评测基准!AI大战顶尖人类,上演机器学习届“神仙打架”;R1排第三,Claude夺冠
编辑 | 李美涵出品 | 51CTO技术栈(微信号:blog51cto)深夜,OpenAI再次发力Agent领域,开源了一个全新的AI Agent评测基准—— PaperBench。 这是一个用于评估 AI 智能体复现最前沿 AI 研究能力的基准测试。 智能体需从零开始复现 20 篇 ICML 2024 Spotlight 和 Oral 论文,包括理解论文贡献、构建代码库并成功执行实验。
4/3/2025 1:35:49 PM
李美涵
OpenAI 的 o3 模型在 2024 国际信息学奥林匹克竞赛中斩获金牌
近期,OpenAI 发布了一项关于其最新推理模型 o3的研究,展示了大型语言模型(LLM)如何从初学者的竞赛程序员成长为全球顶尖水平的竞争者。 o3在著名编程平台 CodeForces 上取得了2724的评分,位于前99.8% 的百分位,表现相当出色,并在2024年国际信息学奥林匹克(IOI)中获得了金牌级别的成绩。 图源备注:图片由AI生成,图片授权服务商Midjourney研究表明,o3模型在 IOI 比赛中超越了专门为此活动微调的 o1-ioi 模型,这一结果表明,通过强化学习取得的成就要优于手工设计的解决方案。
2/13/2025 4:51:00 PM
AI在线
OpenAI更新o3-mini模型,展示了给出答案的 “思维链”
近日,OpenAI 在推出其旗舰 AI 模型 o3和 o3-mini 后,进行了重大更新,改变了 o3-mini 的回应方式。 现在,这款模型不仅能够回答用户的问题,还能展示其思考过程,为用户提供更多透明度。 这一变化标志着 OpenAI 在提升用户体验方面迈出了重要一步,使得 AI 工具的使用变得更加人性化。
2/7/2025 2:40:00 PM
AI在线
o3-mini 思维链公开却被曝光全是“作假”,阿尔特曼现身解释
在展示出来的 CoT 中,o3-mini 一步步思考,这个问题应该是用户在搞幽默,觉得本周应该快结束了,结果还没结束。因此,自己需要给一个聪明机智的回答。
2/7/2025 12:14:48 PM
清源
惊掉下巴!o3像是一个弥天大谎!基准构建者Epoch AI发长文认错曝猛料:OpenAI竟独家访问数据集,问题和答案可用来训练!
出品 | 51CTO技术栈(微信号:blog51cto)惊天大瓜来了! 去年年底OpenAI 推出o3推理,在数学、编码、通用AGI方面都取得了令人的难以置信的类人甚至超人的进展。 但就在昨天,大洋彼岸的一众人工智能专家开始对“o3”的这些数据表示严重的怀疑,甚至将之比作“Theranos”时刻(一家建立在巨大谎言之上的公司,项目参与人员被迫保密,外界却被蒙在鼓里)。
1/20/2025 1:37:16 PM
资讯热榜
Lovart 实战深度测评!仅需4小时帮你完成一整套品牌全案设计!
OpenAI 董事会主席:如果你想快速烧掉百万美元,就开发自己的 AI 模型吧
腾讯Robotics X具身智能开放平台Tairos发布,融合左脑、右脑、小脑
业界首个,腾讯混元 3D 世界模型正式发布并开源
奥尔特曼警告:把 ChatGPT 当作心理治疗师并不安全,对话内容不受法律保护
WAIC 2025 主论坛演讲 | MiniMax 创始人闫俊杰:每个人的 AI
8个月1亿美元ARR神话:Lovable是如何"干翻"OpenAI和Cursor的?
基于 DeepSeek 大模型,河南引入“AI 智审”系统实现货物口岸通关申报“秒级”筛查
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
AI创作
马斯克
论文
智能体
Anthropic
英伟达
代码
算法
Stable Diffusion
训练
芯片
开发者
蛋白质
腾讯
生成式
LLM
苹果
Claude
神经网络
AI新词
3D
研究
机器学习
生成
AI for Science
Agent
xAI
计算
人形机器人
Sora
AI视频
GPU
AI设计
百度
华为
搜索
大语言模型
工具
场景
具身智能
字节跳动
RAG
大型语言模型
预测
深度学习
伟达
视觉
Transformer
AGI
视频生成
神器推荐
亚马逊
Copilot
DeepMind
架构
模态
应用