AIGC宇宙 AIGC宇宙

OpenAI发布新一代GPT-4.1模型,和智谱Z.ai撞期

在人工智能领域,OpenAI 于今日正式推出其最新的 GPT-4.1模型,随之而来还有两个小型版本:GPT-4.1mini 和 GPT-4.1nano。 这一系列新模型的性能相较于前一代 GPT-4o 和 GPT-4o mini 有了显著提升,尤其在编码能力和指令跟踪方面表现突出。 此外,GPT-4.1还具备高达100万个上下文 tokens 的支持能力,极大扩展了处理信息的范围。

在人工智能领域,OpenAI 于今日正式推出其最新的 GPT-4.1模型,随之而来还有两个小型版本:GPT-4.1mini 和 GPT-4.1nano。这一系列新模型的性能相较于前一代 GPT-4o 和 GPT-4o mini 有了显著提升,尤其在编码能力和指令跟踪方面表现突出。此外,GPT-4.1还具备高达100万个上下文 tokens 的支持能力,极大扩展了处理信息的范围。

据测评,GPT-4.1在 SWE-bench Verified 的得分达54.6%,较 GPT-4o 提高了21.4%,在编码模型中处于领先地位。其在指令遵循能力的评分也达到了38.3%,相较于前代提高了10.5%。此外,GPT-4.1在 Video-MME 多模态长上下文理解的测试中取得72.0% 的高分,相较于 GPT-4o 提高了6.7%。这样的成绩表明 GPT-4.1在处理复杂任务和理解长篇文本方面的优势。

ChatGPT

图源备注:图片由AI生成

与此同时,智谱也推出了其新款32B/9B 系列 GLM 模型,直接与 GPT-4.1展开竞争。智谱的 Z.ai 平台现已开放,让用户能够免费体验这些新模型的强大功能。两者的发布恰逢其时,展现了人工智能领域的激烈竞争。

在代码生成方面,GPT-4.1在执行各种编码任务时表现优异,其完成率从33.2% 提升至54.6%。此外,GPT-4.1在跨格式代码差异分析上也显著提高,为 API 开发者节省了大量时间与成本。相比之下,智谱的 GLM-Z1-32B-0414在 IFEval 上的表现也不逊色,达到了84.5% 的高分。

对于长上下文理解,GPT-4.1可以处理高达100万个 tokens,足以应对大型代码库和长篇文档的需求。这种能力使其在法律、客户支持等多领域的应用潜力巨大。

值得一提的是,GPT-4.1的使用成本比其前代降低了26%。相较之下,智谱的 Z.ai 在定价上也极具竞争力,为用户提供了更多选择。

相关资讯

OpenAI推全新语音转录模型gpt-4o-transcribe,语音转文字准确率飙升

继此前在语音 AI 领域引发一些关注后,OpenAI并未停下在该领域探索的脚步,现在这家ChatGPT的创造者再次发力,推出了三款全新的自主研发语音模型,分别为:gpt-4o-transcribe, gpt-4o-mini-transcribe and gpt-4o-mini-tts。 其中最受瞩目的当属gpt-4o-transcribe。 目前,这些新模型已经率先通过应用程序接口(API)向第三方开发者开放,开发者们可以利用它们打造更智能的应用程序。
3/21/2025 9:01:00 AM
AI在线

行业沸腾!GPT-4o动动嘴秒出设计作品!Adobe真的顶得住?

这两天大家都被 OpenAI 的 GPT-4o 刷屏了吧。 这款更新后的多模态 AI 模型,直接把“开口就出图”变成了现实。 你只需要动动嘴皮子,说出想法,专业级别的设计作品就能跃然屏幕。
4/1/2025 12:33:10 AM
彭彭

GPT-4o深度体验10大场景!可能ComfyUI工作流真不用学了

上周我介绍了 gemini 生图模型,我觉得已经算是实用性很强了,但紧接着 Open AI 就卷起来了,也更新了一波图像生成模型,然后迅速在全网刷屏。 那它的效果到底好不好用呢? 是不是被吹的很厉害?
4/3/2025 5:39:24 AM
彩云Sky
  • 1