Vision-R1

DeepSeek-R1的方法迁移到多模态大模型-开源Vision-R1实现方法思路

DeepSeek-R1的方法迁移到多模态大模型-开源Vision-R1实现方法思路

刚开始琢磨使用DeepSeek-R1风格训练多模态R1模型，就看到这个工作，本文一起看看，供参考。先提出问题，仅靠 RL 是否足以激励 MLLM 的推理能力？结论：不能，因为如果 RL 能有效激励推理能力，Vision-R1-Zero 应该表现出生成复杂 CoT 的能力，并在基准测试中提升准确率。

3/13/2025 8:13:47 AM

余俊晖

1

资讯热榜

DeepSeek刚提到FP8，英伟达就把FP4精度推向预训练，更快、更便宜多模态新旗舰MiniCPM-V 4.5：8B 性能超越 72B，高刷视频理解又准又快 Meta 新超级智能实验室遭遇离职潮，AI 人才流失引发担忧宾州州立大学推出首个人工智能工程学位，抢占教育先机联合国成立人工智能咨询小组 AI 安全测试揭示聊天机器人助长恐怖活动与网络犯罪亿万富翁丹・洛布减持台积电，转投另一家万亿人工智能公司深度测评！谷歌全新AI模型Nano Banana（附30+提示词案例）

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek AI绘画谷歌机器人数据大模型 Midjourney 开源智能用户 Meta 微软 GPT 学习技术图像 Gemini 马斯克 AI创作智能体英伟达 Anthropic 论文代码 AI新词训练算法 Stable Diffusion LLM 芯片蛋白质开发者腾讯 Claude 苹果生成式 AI for Science Agent 神经网络 3D 机器学习研究 xAI 生成人形机器人 AI视频计算百度 Sora GPU AI设计华为工具大语言模型 RAG 搜索具身智能字节跳动大型语言模型场景深度学习预测视频生成伟达视觉 Transformer AGI 架构亚马逊神器推荐 Copilot 应用 DeepMind 特斯拉