混合专家

别TM浪费算力了，这样才能最大限度发挥deepseek的潜能 - MOE

别TM浪费算力了，这样才能最大限度发挥deepseek的潜能 - MOE

最近几周自学deepseek原理应用实践，一些成果，和大家分享：小众关心的，deepseek核心技术原理；大众关心的，提示词要怎么写；今天和大家聊聊，deepseek的核心机制之一的混合专家MOE。什么是混合专家MOE？混合专家，Miture of Experts，该模型思路不再追求大而全，转而追求多而专精。

2/10/2025 9:00:00 AM

58沈剑

资讯热榜

GGUF 是什么？一文看懂大模型里最火的模型格式 AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月可灵、即梦、海螺、Vidu哪家强？4大AI视频神器深度测评深度拆解！这可能是全网最详细的AI视频创作教程我为什么离开OpenAI？六年元老发离职长文：AGI将至，我们远没准备好免注册免费用！17种AI绘图模型一站式体验平台LMArena AI 黑话太多看不懂？一文帮你打通：AI, 机器学习, 大模型, LLM, Agent 都是啥关系？ OpenAI在德败诉！AI训练使用歌词被认定侵权，欧洲生成式AI版权监管迎来分水岭

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek 谷歌 AI绘画大模型机器人数据 Midjourney 开源 AI新词 Meta 微软智能用户 GPT 学习技术智能体马斯克 Gemini Anthropic 英伟达图像 AI创作训练 LLM 论文代码算法 AI for Science Agent Claude 苹果芯片腾讯 Stable Diffusion 蛋白质开发者 xAI 生成式神经网络机器学习 3D 具身智能 RAG AI视频人形机器人研究大语言模型百度生成 GPU Sora 工具华为计算字节跳动 AI设计大型语言模型 AGI 搜索视频生成场景生成式AI 深度学习 DeepMind 架构 MCP AI模型亚马逊特斯拉 Transformer 编程视觉预测