AIGC宇宙 AIGC宇宙

DeepSeek 全新开源R1-0528 模型登场,性能媲美 OpenAI o3 模型

今天凌晨,知名的开源大模型平台 DeepSeek 发布了其最新版本 R1(0528),引起了广泛关注。 此次发布没有附带详细说明,DeepSeek 选择了 “悄然” 开放模型,预计后续会发布模型卡,进一步介绍其功能。 据悉,R1-0528版本的性能在著名代码测试平台 Live CodeBench 上的测试结果显示,其表现与 OpenAI 最新的 o3模型相当。

今天凌晨,知名的开源大模型平台 DeepSeek 发布了其最新版本 R1(0528),引起了广泛关注。此次发布没有附带详细说明,DeepSeek 选择了 “悄然” 开放模型,预计后续会发布模型卡,进一步介绍其功能。

据悉,R1-0528版本的性能在著名代码测试平台 Live CodeBench 上的测试结果显示,其表现与 OpenAI 最新的 o3模型相当。很多网友对此表示期待,纷纷对新版本进行了测试,发现新版 R1在风格和表现上都与 OpenAI 的 o3模型相似。

具体来说,R1-0528在专业风格的响应方面,显示出了 o3-2.5的特征。无论是在使用箭头和星号的方式上,还是在结尾部分 “why it works” 的表述上,R1都展现出了很高的说服力。虽然 OpenAI 在不断努力提升其模型性能,但 DeepSeek 的 R1依然表现得相当出色,令人期待其后续版本 R2的智能表现。

image.png

Hyperbolic Labs 的联合创始人兼首席执行官也表示,R1依旧是能精确回答 “9.9” 和 “9.11哪个更大” 的模型,这一能力凸显了其高水平的智能表现。此外,知名 AI 评论人 Haider 也对新版本 R1赞不绝口,他提到,在一次编程挑战中,R1成功构建了一个单词评分系统,并提供了整洁的代码和可运行的测试用例,首次运行便完美通过。

Haider 指出,以前只有 o3模型能够完成这样的任务,而现在 DeepSeek 的 R1也达到了这样的水平。他表示,尽管模型的思考时间似乎有所延长,但其智能水平却令人惊叹。随着测试的深入,大家不禁思考,DeepSeek 是否在有意将此次 R1版本作为过渡,以防止后续 R2的发布让用户失望。

新版 DeepSeek R1表现不俗,不仅能够像 o3一样进行思维链的自我纠正,还具备了类似 Claude 的创造性构建能力,这是之前版本所不具备的。随着官方模型卡的发布,AIGC 开放社区也将为大家带来更深入的解析,期待未来的更多惊喜。

开源地址:https://huggingface.co/deepseek-ai/DeepSeek-R1-0528/tree/main

划重点:  

🌟 新版 DeepSeek R1(0528)开源,性能媲美 OpenAI o3模型。  

💻 测试显示 R1在编程能力上表现出色,成功完成复杂任务。  

🔍 期待 DeepSeek 后续发布模型卡,深入解析新版本功能。

相关资讯

微软、英伟达带头接入Deepseek OpenAI紧急寻求400亿美元新融资

近日,微软、英伟达和亚马逊 AWS 等行业领军企业纷纷接入 Deepseek 的模型托管服务。 这一消息不仅让人对 Deepseek 的前景充满期待,同时也昭示着 AI 行业将迎来新的变革。 与此同时,OpenAI 也在积极筹集新一轮资金,寻求高达400亿美元的融资。
2/2/2025 10:49:00 AM
AI在线

AI新功能震惊网友:轻松破解照片拍摄位置

近日,OpenAI 推出的 o3模型因其能够精准猜测照片拍摄位置而引发广泛关注。 这一功能由 Django Web 框架的创始人 Simon Wilson 首次测试,他在自己的博客中详细记录了 o3的推理过程,称这一体验既超现实又令人不安。 Wilson 随意拍了一张看似平常的照片,包含了些许道路和房屋,却没有明显的标志性建筑。
4/28/2025 10:01:34 AM
AI在线

长文本理解新王者?Gemini2.5Pro 击败 o3领跑 Fiction.Live 基准测试

在最近的 Fiction.Live 基准测试中,Gemini2.5Pro 在理解和再现复杂故事和背景方面表现出色,领先于竞争对手 OpenAI 的 o3模型。 这项测试远超传统的“大海捞针”式任务,专注于模型在海量上下文中处理深层语义和背景依赖信息的能力。 据测试数据显示,在上下文窗口长度达到192,000个词条(约14.4万个单词)时,o3模型性能急剧下滑,而 Gemini2.5Pro 的6月预览版(preview-06-05)在同一条件下依然保持了超过90% 的准确率。
6/9/2025 9:00:56 AM
AI在线
  • 1