Claude 3.7 Sonnet

AI“推理”模型兴起，基准测试成本飙升

AI“推理”模型兴起，基准测试成本飙升

AI推理模型测试成本高昂，OpenAI的o1模型测试费用高达2767美元，是普通模型的数倍。专家指出，高昂成本源于token生成量大，且基准测试复杂度提升。#AI测试成本# #推理模型#

4/13/2025 10:05:25 AM

远洋

微软研究：AI 编程助手软件调试能力堪忧

微软研究：AI 编程助手软件调试能力堪忧

微软最新研究表明，包括Claude 3.7 Sonnet和OpenAI o3-mini在内的多款AI模型在软件调试任务中表现不佳，最高成功率不足50%。研究指出，缺乏足够的调试痕迹数据是主要原因。#AI编程##微软研究#

4/13/2025 9:14:01 AM

远洋

用AI把PDF一键变成能玩的可视化网页，这不比PPT酷多了？

用AI把PDF一键变成能玩的可视化网页，这不比PPT酷多了？

前几天，看到好基友歸藏在 X 上发了一个帖子：还挺爆，一天半的时间过去，已经有 17.3 万的阅读了。这个东西，简单点说，就是用一个 Prompt，把一些非常难以阅读的文字报告，一键转成更舒服更易读的可视化网页。甚至，还是能交互的那种。

3/13/2025 6:53:33 AM

数字生命卡兹克

Claude 3.7 Sonnet深夜上线，AI编程的天又被捅破了

Claude 3.7 Sonnet深夜上线，AI编程的天又被捅破了

AI 这个行业真的卷生卷死，凌晨 2 点半，刚想早睡一点点，9 点起来蹲 DeepSeek 的开源。结果，Claude 直接玩偷袭了。 Claude 3.7 Sonnet 来了，也是 Claude 家族，第一个能推理的模型。

2/26/2025 12:54:18 AM

数字生命卡兹克

1

资讯热榜

苹果发布全新Xcode 26开发者工具：内置ChatGPT先进AI功能 DeepSeek前高管秘密创业，新AI Agent项目已获顶级VC押注那个男人回来了！Ilya现身多伦多大学毕业典礼：AI 像是用数字方式复制出来的大脑！不管你愿不愿意，AI都将深刻影响你的一生！ ChatGPT 语音功能升级，实时翻译对话更自然流畅支持MCP！开源智能体开发框架 Rowboat：打造你的智能助手只需几分钟谷歌 Gemini 应用月下载量超越 ChatGPT，用户活跃度仍显不足长文本理解新王者?Gemini2.5Pro 击败 o3领跑 Fiction.Live 基准测试肝了30小时，Flux Kontext是我用过最稳、最能干活的AI图像模型！

标签云

人工智能 AI OpenAI AIGC 模型 ChatGPT DeepSeek AI绘画数据谷歌机器人大模型 Midjourney 用户智能开源微软 GPT 学习 Meta 图像技术 AI创作 Gemini 论文马斯克 Stable Diffusion 算法代码英伟达 Anthropic 芯片生成式开发者蛋白质腾讯神经网络研究 3D 生成训练苹果计算智能体 Sora 机器学习 AI设计 AI for Science Claude GPU AI视频人形机器人华为搜索场景百度大语言模型 xAI 预测伟达深度学习 Transformer 字节跳动 Agent 模态具身智能神器推荐 LLaMA 文本视觉 Copilot 算力工具 LLM 驾驶 API 大型语言模型应用 RAG 亚马逊