OpenAI
满血o3降智和幻觉倍增的原因可能找到了
OpenAI推出的满血O3“跑分”(Benchmark)貌似又被独立测试揭穿是刷榜了,而奇怪的测试基准数据可能就是o3降智和幻觉倍增的原因? 你可能要问了,一个数学基准测试,与降智和幻觉有什么关系? 事情要从去年12月说起。
4/22/2025 9:18:57 AM
AI寒武纪
数据:ChatGPT 搜索在欧洲迅速增长
根据 OpenAI 在其最新报告中披露的信息,ChatGPT 搜索功能在欧洲的增长势头惊人。 ChatGPT 搜索允许用户通过聊天机器人获取最新的网络信息,并将这些信息整合到回答中。 OpenAI 的欧盟子公司 OpenAI Ireland Limited 表示,在截至今年3月31日的六个月内,ChatGPT 搜索的平均每月活跃用户数已达到约4130万,这一数字相比于2024年10月31日的六个月内的1120万用户,显著增加。
4/22/2025 9:00:40 AM
AI在线
ChatGPT 搜索在欧洲增长迅猛,欧盟监管利剑高悬
OpenAI报告显示,ChatGPT Search在欧盟的活跃用户数半年内增长近3倍,达到4130万,接近DSA规定的4500万门槛。一旦超过,将面临更严格监管,包括数据共享和外部审计等要求。#ChatGPT #欧盟监管
4/22/2025 7:00:55 AM
远洋
被Cursor多次拒绝,OpenAI怒买Windsurf,很不划算!多少有点慌不择食
编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)经历了OpenAI的o3和谷歌的Gemini 2.5 Flash发布之后,AI圈的注意力再一次给到了编程赛道。 最近一个争议比较大的新闻,要属“OpenAI收购Cursor不成,反过来要收购AI编程初创里的老二Windsurf”。 30亿美元,特别是对于一家仅仅成立2年,且目前品牌运营时间仅约5个月的创业公司来说,可以说是非常体面和梦寐以求的退出额度。
4/21/2025 5:18:15 PM
云昭
你对ChatGPT多说一句谢谢,OpenAI就要多花一笔钱
在如今这个人工智能(AI)日益渗透生活的时代,AI 已经成为我们日常对话和问题解决的重要助手。 然而,您或许不知道,这些看似简单的日常互动实际上蕴含着巨大的成本。 OpenAI 的首席执行官山姆・奥尔特曼(Sam Altman)透露,仅仅是为了处理用户之间的寒暄与礼貌用语,公司每年就需支出数千万美元。
4/21/2025 5:00:37 PM
AI在线
o3/o4-mini幻觉暴增2-3倍!OpenAI官方承认暂无法解释原因
OpenAI新模型发布后,大家体感都幻觉更多了。 甚至有人测试后发出预警:使用它辅助编程会很危险。 图片具体来说,它经常捏造从未运行过的代码返回结果,在被质问时找理由狡辩,甚至还会说是用户的错。
4/21/2025 4:25:58 PM
选 AI 比选对象还难!“起名黑洞”OpenAI 的新模型,到底怎么选?
即便是 AI 圈的资深团队,在面对同时发布的 o3、o4-mini、GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano 时,也是蒙圈的。
4/21/2025 1:38:47 PM
清源
OpenAI CEO批评礼貌语言浪费:与AI对话不需要“请”和“谢谢”
OpenAI的首席执行官萨姆·奥特曼(Sam Altman)近日提出了一个具有挑战性的观点,称与ChatGPT这样的聊天机器人使用礼貌语言,如“请”和“谢谢”,实际上是一种浪费,耗费了大量的电力和计算资源。 奥特曼指出,尽管许多人认为与人工智能保持礼貌是一种文化上的必要行为,或者有助于提升交互质量,但这种做法却无形中增加了人工智能系统的负担。 每次使用礼貌语言时,聊天机器人不仅要识别和处理这些词汇,还需要生成长而复杂的回应,所有这些都需要大量的计算资源和电力支持。
4/21/2025 11:00:46 AM
AI在线
OpenAI o3 模型测试成绩遭质疑,实际表现远低于宣传
近日,OpenAI 推出的 o3人工智能模型在基准测试中的表现引发了广泛争议。 尽管 OpenAI 在去年12月首次发布 o3时自信地宣称该模型在极具挑战性的 FrontierMath 数学问题集上能够正确回答超过四分之一的问题,但这一声称与最近的独立测试结果形成鲜明对比。 Epoch 研究所对 o3模型进行了独立测试,结果显示该模型的实际得分仅为10%,远低于 OpenAI 之前所宣称的25%。
4/21/2025 10:00:56 AM
AI在线
Netflix推全新 AI 搜索功能,用户可通过自然语言搜索
Netflix 近日开始测试一项全新的 AI 搜索功能,这一功能基于 OpenAI 的技术,旨在提升用户在流媒体平台上的内容发现体验。 用户将能够通过自然语言来搜索影片,不再局限于传统的按类型或演员进行搜索。 据彭博社的报道,这项新功能能够理解用户更具体的需求,包括他们的观影心情。
4/21/2025 10:00:56 AM
AI在线
OpenAI 4o图像生成支持自定义GPTs,个性化AI创作再升级
近日,OpenAI宣布其最新4o模型的图像生成功能将支持自定义GPTs,为用户提供更灵活的个性化AI创作体验。 据AIbase了解,这一更新允许开发者与用户基于4o模型构建定制化的GPTs,生成符合特定需求的高质量图像内容。 消息一经发布,便引发了AI社区的广泛讨论,标志着OpenAI在个性化AI工具领域的又一重要进展。
4/21/2025 9:00:47 AM
AI在线
OpenAI CFO重磅曝料:AGI近在咫尺,全球最强编程智能体已就绪!
OpenAI,正引领生成式AI的革命浪潮。 这家公司如何确立行业领先地位? 又采取了哪些策略保持竞争优势?
4/21/2025 8:35:00 AM
新智元
OpenAI o3 模型基准测试成绩遭质疑,实测分数远不及宣称
OpenAI的o3模型在内部测试与第三方基准测试结果存在显著差异,Epoch研究所独立测试得分仅10%,远低于OpenAI宣称的25%。#AI争议##OpenAI#
4/21/2025 7:24:55 AM
远洋
对 ChatGPT 说“谢谢”,竟给 OpenAI 带来“数千万美元”开销
OpenAI CEO透露,仅仅是用户与AI进行的日常寒暄和礼貌性交流,例如“谢谢”和“请”等,就给公司带来了“数千万美元”的开销。#AI成本# #人机互动#
4/20/2025 11:36:07 AM
远洋
ChatGPT 直呼用户姓名引负面反响,用户直呼“毛骨悚然”
部分用户发现ChatGPT会直呼其名,即便未透露姓名也会被称呼,引发负面反响。开发者认为这一功能“令人毛骨悚然”,用户表示困惑和警惕。OpenAI尚未回应,这一现象凸显了AI个性化尝试的“恐怖谷”困境。#ChatGPT##人工智能#
4/20/2025 7:27:19 AM
远洋
计划 30 亿美元收购 Windsurf 前,OpenAI 被曝曾向另一 AI 编程助手 Cursor“示好”
知情人士告诉CNBC,去年OpenAI曾联系Cursor的销售商Anysphere,并在Cursor迎来新一轮热潮时再次接触了它。但谈判始终未能取得实质性进展。
4/19/2025 2:21:43 PM
清源
ChatGPT 低调上线“记忆搜索”功能:个性化搜索结果更精准
ChatGPT在进行网页搜索时,将能够结合记忆中存储的个人信息(IT之家注:例如用户过去提到的饮食偏好)来优化搜索结果。
4/19/2025 8:39:31 AM
清源
OpenAI 新推理模型被曝产生更多“幻觉”,o3 / o4-mini 性能与错误率一同提升
根据 OpenAI 的内部测试,作为推理模型的 o3 和 o4-mini,出现幻觉的频率不仅超过了前代推理模型 o1、o1-mini 和 o3-mini,甚至还高于传统“非推理”模型(IT之家注:如 GPT-4o)。
4/19/2025 7:46:39 AM
清源
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
马斯克
AI创作
智能体
论文
英伟达
Anthropic
代码
算法
训练
Stable Diffusion
芯片
蛋白质
开发者
腾讯
LLM
生成式
苹果
Claude
Agent
AI新词
神经网络
3D
AI for Science
机器学习
研究
生成
xAI
人形机器人
AI视频
计算
Sora
GPU
AI设计
百度
华为
工具
大语言模型
搜索
具身智能
场景
RAG
字节跳动
大型语言模型
预测
深度学习
伟达
视觉
Transformer
视频生成
AGI
神器推荐
亚马逊
架构
Copilot
DeepMind
应用
安全