AIGC宇宙 AIGC宇宙

OpenAI 发布 GPT-4.5:迄今最强大模型亮相 强化推理与情感智能

2025年2月27日—— OpenAI 于今日正式推出其最新语言模型 GPT-4.5,作为研究预览版率先提供给 ChatGPT Pro 用户(每月订阅费200美元)。 这款被誉为“迄今为止最大、最知识渊博”的模型基于 GPT-4o 构建,在推理能力、情感智能以及写作、编程等实用功能上实现显著提升。 OpenAI 表示,未来几周内,GPT-4.5将逐步开放给 Plus、Team、Enterprise 和 Edu 用户,标志着人工智能技术的又一里程碑。

2025年2月27日—— OpenAI 于今日正式推出其最新语言模型 GPT-4.5,作为研究预览版率先提供给 ChatGPT Pro 用户(每月订阅费200美元)。这款被誉为“迄今为止最大、最知识渊博”的模型基于 GPT-4o 构建,在推理能力、情感智能以及写作、编程等实用功能上实现显著提升。OpenAI 表示,未来几周内,GPT-4.5将逐步开放给 Plus、Team、Enterprise 和 Edu 用户,标志着人工智能技术的又一里程碑。  

QQ_1740702075149.png

功能亮点:更聪明、更自然

GPT-4.5在多个领域展现了令人瞩目的进步。根据 OpenAI 发布的系统卡片,该模型通过监督微调(SFT)和强化学习(RLHF)训练,显著减少了“幻觉”现象(错误或虚构信息),并提升了情感智能和用户交互的自然度。例如,在 PersonQA 测试中,GPT-4.5的幻觉率仅为19%,远低于 GPT-4o 的52%。  用户体验方面,GPT-4.5在写作和编程任务中表现出色,能够生成更具创造性和审美直觉的内容,同时更准确地理解用户意图。X 用户 Simon Willison 在试用后表示:“它在知识深度和生成内容(如绘制鹈鹕)方面表现更好,交互体验更自然。”此外,模型支持文件和图像上传,并集成了 ChatGPT 的画布工具,但目前暂不支持语音、视频或屏幕共享等多模态功能。  

QQ_1740702106427.png

数据与安全:透明与责任并重

OpenAI 透露,GPT-4.5的训练数据来源于多样化渠道,包括公开数据、专有合作伙伴数据以及内部定制数据集,经过严格过滤以确保质量并保护隐私。安全方面,模型配备 Moderation API 和分类器,有效防止生成有害内容。  在第三方评估中,Apollo Research 和 METR 对 GPT-4.5的欺骗风险和自主性进行了测试,结果显示其总体风险为“中等”。尤其在化学、生物、放射性核材料(CBRN)和说服力领域风险中等,而网络安全和模型自主性风险较低。OpenAI 已采取措施,如预训练过滤 CBRN 数据并监控潜在滥用,以确保安全性。  

用户反馈:能力提升但速度待优化

QQ_1740702128234.png

首批用户的反馈显示,GPT-4.5在知识广度和创造性方面广受好评。X 用户 @pckraftwerk 称赞其“写作和编码能力显著增强,幻觉现象减少”。然而,速度问题也引发关注。Simon Willison 指出,通过 API 使用时,GPT-4.5的响应速度较慢,可能影响实时应用场景。他还透露,该模型使用了比 GPT-4多10倍的训练计算资源,性能提升背后是巨大的投入。  

此外,OpenAI 明确表示,GPT-4.5并非专为深度推理设计,建议用户在需要复杂推理时选择 o1或 o3-mini 模型,这一定位也引发了部分讨论。  

市场影响与未来展望

作为 OpenAI 的最新力作,GPT-4.5被认为将在写作、编程和问题解决等领域推动生产力革新。其多语言表现同样亮眼,在 MMLU 基准测试中,英语准确率达0.896,西班牙语0.8840,阿拉伯语0.8598,全面超越 GPT-4o。  业内人士预测,随着 GPT-4.5逐步推广,其强大的功能和较高的安全性将进一步巩固 OpenAI 在 AI 领域的领先地位。未来,OpenAI 计划根据用户反馈优化模型,并可能扩展语音和视频等功能,进一步丰富其应用场景。  

结语

GPT-4.5的发布不仅展示了 OpenAI 在技术上的雄心,也凸显了其对安全和用户体验的重视。尽管速度问题尚待解决,但这款模型无疑为 AI 的发展开启了新的篇章。正如 OpenAI 在声明中所说:“我们希望 GPT-4.5能为用户带来更智能、更可靠的助手体验。”  

相关资讯

OpenAI低调更新GPT4o模型,多项能力反超DeepSeek

近日,OpenAI 对其 ChatGPT 的 GPT4o 模型进行了更新,这一消息由 OpenAI 的首席执行官 Sam Altman 在社交平台 X 上透露。 Altman 表示,此次更新是在上个周末进行的,旨在进一步提升用户的使用体验。 他强调,新版本的模型在使用过程中表现出色,给用户带来了更为顺畅的体验。
2/18/2025 10:18:00 AM
AI在线

自有歪果仁为DeepSeek「辩经」:揭穿围绕DeepSeek的谣言

围绕 DeepSeek 的谣言实在太多了。 面对 DeepSeek R1 这个似乎「一夜之间」出现的先进大模型,全世界已经陷入了没日没夜的大讨论。 从它的模型能力是否真的先进,到是不是真的只用了 550W 进行训练,再到神秘的研究团队,每个角度都是话题。
2/5/2025 2:37:00 PM
机器之心

程序员购买OGOpenAI.com域名转向DeepSeek

最近,一名软件工程师以 “不到一顿 Chipotle 餐的价格” 购买了 OGOpenAI.com 域名,并将其重定向至中国人工智能实验室 DeepSeek 的网站。 该实验室在开源 AI 领域崭露头角,吸引了广泛的关注。 据软件工程师阿纳奈・阿罗拉(Ananay Arora)向《TechCrunch》透露,他的初衷是为了支持 DeepSeek,因为该实验室最近推出了一款名为 DeepSeek-R1的开放版本模型,声称在某些基准测试中表现优于 OpenAI 的 o1。
1/23/2025 4:32:00 PM
AI在线
testab