scaling

DeepSeek R2来了？全新推理时Scaling论文联手清华震撼发布！

DeepSeek R2，果然近了。最近，DeepSeek和清华的研究者发表的这篇论文，探讨了奖励模型的推理时Scaling方法。图片论文地址：，强化学习（RL）已广泛应用于LLM的大规模后训练阶段。

4/7/2025 3:44:00 AM

新智元

DeepSeek爆火后的新Scaling Law究竟是什么？

出品 | 51CTO技术栈（微信号：blog51cto）嘉宾 | 周博洋、魏新宇采访 | 薛彦泽撰稿 | 李美涵DeepSeek R1的发布在全球人工智能领域引发了巨大反响。这款由中国初创企业DeepSeek推出的低成本、高性能AI模型，打破了人们对AI研发“高投入、长周期”的固有认知，被西方媒体誉为“人工智能的斯普特尼克时刻”。 DeepSeek的“奇迹”有目共睹。

3/14/2025 11:18:19 AM

伊风

资讯热榜

GGUF 是什么？一文看懂大模型里最火的模型格式 AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月免注册免费用！17种AI绘图模型一站式体验平台LMArena 可灵、即梦、海螺、Vidu哪家强？4大AI视频神器深度测评深度拆解！这可能是全网最详细的AI视频创作教程如何去除AI绘画的油腻感？这2个实用方法别错过！ Gemini 3重磅发布，我连夜整理了3大核心亮点与5种免费用方法！ OpenAI 首次推出 ChatGPT 群聊功能，将在韩国与新西兰率先试点

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek 谷歌 AI绘画大模型机器人数据 AI新词 Midjourney 开源 Meta 微软智能用户 GPT 学习技术智能体马斯克 Gemini Anthropic 英伟达图像 AI创作训练 LLM 论文代码算法 AI for Science 苹果 Agent Claude 芯片腾讯 Stable Diffusion 蛋白质开发者 xAI 具身智能生成式神经网络机器学习 3D 人形机器人 AI视频 RAG 大语言模型研究百度 Sora 生成 GPU 工具华为计算字节跳动 AI设计 AGI 大型语言模型搜索生成式AI 视频生成场景 DeepMind 特斯拉深度学习 AI模型架构亚马逊 MCP Transformer 编程视觉预测