AIGC宇宙 AIGC宇宙

初探 Deepseek R1-0528 开源模型:AI 编程能力跃升,媲美 OpenAI o3 和 o4-mini

深度求索(Deepseek)昨日通过官方交流群,邀请用户测试 DeepSeek-R1-0528 模型小版本,初步测试结果表明,R1-0528 在编程能力、审美设计和代码补全等方面表现出色,尤其在复杂指令处理和前端页面生成上展现了高精度和高效能。

深度求索(Deepseek)昨日通过官方交流群,邀请用户测试 DeepSeek-R1-0528 模型小版本,初步测试结果表明,R1-0528 在编程能力、审美设计和代码补全等方面表现出色,尤其在复杂指令处理和前端页面生成上展现了高精度和高效能。

DeepSeek-R1-0528 模型在多个方面实现了性能提升,其中最为亮眼的就是编程能力,能根据用户输入的简单提示词,快速生成高质量代码。

初探 Deepseek R1-0528 开源模型:AI 编程能力跃升,媲美 OpenAI o3 和 o4-mini

代码测试平台 Live CodeBench 中显示,其性能可以媲美 OpenAI 最新的 o3 模型(High)。

初探 Deepseek R1-0528 开源模型:AI 编程能力跃升,媲美 OpenAI o3 和 o4-mini

在 Extended NYT Connections 跑分中,DeepSeek-R1-0528 模型跑分为 49.8 分,而初代 Deepseek R1 模型为 38.6 分。

初探 Deepseek R1-0528 开源模型:AI 编程能力跃升,媲美 OpenAI o3 和 o4-mini

AI在线注:Extended NYT Connections 是一个用于评估大型语言模型(LLM)性能的基准测试,基于《纽约时报》的 Connections 谜题游戏。

这个基准测试包含了 651 个 NYT Connections 谜题,并且增加了额外的词汇以提高难度,旨在更全面地测试模型的语言理解和推理能力。

R1-05-28 具有 o3-2.5 专业风格的响应。箭头 / 星号的使用与 o3 风格非常一致,结尾处“why it works”的表述更具说服力。

初探 Deepseek R1-0528 开源模型:AI 编程能力跃升,媲美 OpenAI o3 和 o4-mini

此外,在审美设计和代码补全(code completion)方面,R1-0528 同样表现卓越。测试中,该模型轻松应对多样化任务,输出结果精准且实用。

在生成复杂前端页面和动态动画方面,R1-0528 也展现了强大的能力,能准确理解复杂指令。更重要的是,相比较 OpenAI 的 o3 和 o4-mini 模型,R1-0528 大幅缩短了推理时长,提供了更加流畅和高效的使用体验。

相关资讯

我用 Claude Sonnet 和 DeepSeek R1 开发一个同样的工具,看谁更厉害!

先给 DeepSeek 泼一盆冷水,DeepSeek 在编程能力上和 Claude Sonnet 还是差了一大截的。 下面有使用 Sonnet 3.5 和 DeepSeek R1 配合 Trae 实现一个推文生成图片卡片小插件的过程,功能虽小,但还是能看出差距的。 这两天 Trae 不是推出了国内版吗 (), 搭载豆包和 DeepSeek 大模型,因为之前 Trae 国际版是支持 Claude Sonnet 的,最开始是 3.5,后来 Claude 升级了 3.7,隔了一天 Trae 就跟进了,而且也是完全免费的。
3/6/2025 12:22:00 AM
风筝

24B模型编程超DeepSeek全家桶,32G内存苹果电脑就能跑,专门针对真实GitHub Issue训练

Mistral沉默好久,果然在憋大招。 刚刚发布最新开源编程模型Devstral,在软件工程任务上一举超过DeepSeek全家桶和Qwen3 235B。 并且参数只有24B,可以在单卡RTX4090甚至32G内存的Mac上运行。
5/22/2025 1:43:40 PM

中国团队首次夺魁!无问芯穹FlightVGM获FPGA'25最佳论文,峰值算力超GPU21倍

国际可重构计算领域顶级会议 ——FPGA 2025 在落幕之时传来消息,今年的最佳论文颁发给了无问芯穹和上交、清华共同提出的视频生成大模型推理 IP 工作 FlightVGM,这是 FPGA 会议首次将该奖项授予完全由中国大陆科研团队主导的研究工作,同时也是亚太国家团队首次获此殊荣。 这项工作首次在 FPGA 上实现了视频生成模型(Video Generation Models, VGMs)的高效推理,也是该团队继去年在 FPGA 上加速大语言模型 FlightLLM(FPGA’24)后的最新系列工作。 与 NVIDIA 3090 GPU 相比,FlightVGM 在 AMD V80 FPGA 上实现了 1.30 倍的性能提升与 4.49 倍的能效提升(峰值算力差距超过 21 倍)。
3/3/2025 12:16:48 PM
机器之心
  • 1