成本仅DeepSeek三分之一！阿里发布全球最强开源大模型Qwen3系列

小道消息一直在说，前天深夜或者昨天凌晨，阿里会发 Qwen3。然后我特意早早的睡了一两小时，凌晨 1 点起床，就为了等 Qwen3 发。结果这一等，就是好几个小时。

小道消息一直在说，前天深夜或者昨天凌晨，阿里会发 Qwen3。

然后我特意早早的睡了一两小时，凌晨 1 点起床，就为了等 Qwen3 发。

结果这一等，就是好几个小时。。。

不过，功夫不负有心人。

凌晨 5 点，我眼睛都睁不开的时候，终于等到了。

成本仅DeepSeek三分之一！阿里发布全球最强开源大模型Qwen3系列

Qwen 你赔我睡眠。。。

把报告看完，我总结一下，觉得最大的亮点有 6 个：

模型能力登顶全球，这个没啥可说的，就是 No.1。
第一个开源的混合推理模型。
8 个不同尺寸的模型，几乎覆盖了所有场景。
成本很低，旗舰模型 235B 参数部署成本只要 DeepSeek R1 的三分之一。
支持 MCP 协议。
居然还支持了 119 种语言。

一起说吧。

成本仅DeepSeek三分之一！阿里发布全球最强开源大模型Qwen3系列

这次发了 8 个模型，Qwen3-0.6B、1.7B、4B、8B、14B、32B，这 6 个都是 Dense 稠密模型。

还有两个重量级 MoE 模型，Qwen3-30B-A3B，和旗舰版的 Qwen3-235B-A22B。

成本仅DeepSeek三分之一！阿里发布全球最强开源大模型Qwen3系列

这次 Qwen 采用了新的命名方式，Qwen3-0.6B、1.7B、32B 这种没啥可说的，大家都理解。

两个 MoE 模型，把激活的参数写在后面，Qwen3-235B-A22B 的意思就是 235B 的参数，但是在推理时只激活 22B。

Qwen3-30B-A3B 就是总参数量为 30B，激活参数 3B，这个还蛮有意思的。

而且，所有的模型，都是混合推理模型。

大概的意思就是，你既可以把它当不会长思考没有思维链的普通模型用，也可以直接开启推理模式，变成一个推理模型。

可以简单的理解为，把 DeepSeek V3 和 R1 直接揉在了一起。

就像我们其实都知道，DeepSeek 这个深度思考，你打开的时候，是 R1 模型，但是你关掉，其实用的是 v3 来给你回答。

成本仅DeepSeek三分之一！阿里发布全球最强开源大模型Qwen3系列

但是 Qwen3，是一体的。

成本仅DeepSeek三分之一！阿里发布全球最强开源大模型Qwen3系列

是一个模型，只不过支持了两种模式，这个不管对于开发者还是使用者，都方便很多。

整体上，8 个模型，诚意足到爆炸，小到 0.6B，大到 235B，能打手机端侧，也能打旗舰体验，全部一次性开源了，而且都是 Apache 2.0 协议，想怎么用就怎么用，想商用就商用，没啥顾虑。

Qwen3-0.6B~4B 的最大 Token 都是 32K，其他的都是 128K。

性能上，稍微有点离谱。

Qwen3-4B 的小模型，就已经能和上一代 QwQ-32B 这玩意打得有来有回。而 Qwen3-30B-A3B，更是几乎就比 QwQ-32B 全方位的强。

成本仅DeepSeek三分之一！阿里发布全球最强开源大模型Qwen3系列

至于最牛逼的那个 Qwen3-235B-A22B，他们甚至没只跟开源模型比，比的全都是最顶级的闭源模型。

最主要的是，这玩意部署成本，大概只有 DeepSeek R1 的三分之一啊。。。

成本仅DeepSeek三分之一！阿里发布全球最强开源大模型Qwen3系列

什么叫便宜大碗，这就是。

但是这么一对比，忽然发现，Gemini2.5-Pro，好像有点猛。。。

同时，在性能水桶式提升的背景下，也有了更强的 Agent 能力，也支持 MCP 了。

他们官方自己放了一段视频。

我也随手把即梦接了进去，可以直接用 Qwen3 来调用即梦画图了。。。

成本仅DeepSeek三分之一！阿里发布全球最强开源大模型Qwen3系列

就还真的，挺好玩，你的下一个即梦，又何必是即梦呢（狗头。

成本仅DeepSeek三分之一！阿里发布全球最强开源大模型Qwen3系列

除了这些模型的能力，Qwen3 这次还有一个很有趣的东西。

就是语言。

上一代的 Qwen2.5，只支持包括中文、英文、法文、西班牙文、葡萄牙文、德文、意大利文、俄文、日文、韩文、越南文、泰文、阿拉伯文等 29 种语言。

而这一次，支持 119 种语言了。

成本仅DeepSeek三分之一！阿里发布全球最强开源大模型Qwen3系列

不是，到底谁才是真正的 OpenAI 啊。

这妥妥是为世界人民谋福利好吧。。。

项目地址都在这了。

Blog: https://qwenlm.github.io/blog/qwen3/

GitHub: https://github.com/QwenLM/Qwen3

成本仅DeepSeek三分之一！阿里发布全球最强开源大模型Qwen3系列

你牛逼的话可以自己部署，我 5080 勉强跑个 Qwen3-8B，实在跑不起。

想体验的话，可以直接去通义和 Qwen Chat，都可以。

通义： https://www.tongyi.com/qianwen/

Qwen Chat： https://chat.qwen.ai/

我自己直接在 Qwen Chat 上面实测了一波，一进来左上角就默认是旗舰版 Qwen3。

成本仅DeepSeek三分之一！阿里发布全球最强开源大模型Qwen3系列

嗯，就是比较抽象的是，提示语都居然都变成早上好，卡兹克了。。。

你可以在左上角，切换 3 个这次 Qwen3 比较有代表的模型来进行对比。

成本仅DeepSeek三分之一！阿里发布全球最强开源大模型Qwen3系列

左下角的深度思考，就能是否开启推理的开关。

而且这个开关还能拖动滑块，决定它的最大思考长度，虽然这个功能很极客，但是还有意思。

成本仅DeepSeek三分之一！阿里发布全球最强开源大模型Qwen3系列

我自己的实测结论就是：水桶级别，中等偏上。

比如让它给我生成一个登录页。

成本仅DeepSeek三分之一！阿里发布全球最强开源大模型Qwen3系列

效果很不错，能直接干出一个很酷的界面。

成本仅DeepSeek三分之一！阿里发布全球最强开源大模型Qwen3系列

或者做藏师傅搞得可交互的网页，把吃瓜 PDF 变成在线时间线。

成本仅DeepSeek三分之一！阿里发布全球最强开源大模型Qwen3系列

这时候你就会发现，审美会差一点，丰富度也会不是特别够，稍微有一点点勉强了。

成本仅DeepSeek三分之一！阿里发布全球最强开源大模型Qwen3系列

藏师傅之前的可视化网页 Prompt 如下：

我会给你一个文件，分析内容，并将其转化为美观漂亮的中文可视化网页作品集：

## 内容要求
- 保持原文件的核心信息，但以更易读、可视化的方式呈现
- 在页面底部添加作者信息区域，包含：
* 作者姓名: [作者姓名]
* 社交媒体链接: 至少包含 Twitter/X：
- 版权信息和年份
## 设计风格
- 整体风格参考 Linear App 的简约现代设计
- 使用清晰的视觉层次结构，突出重要内容
- 配色方案应专业、和谐，适合长时间阅读
## 技术规范
- 使用 HTML5、TailwindCSS 3.0+（通过 CDN 引入）和必要的 JavaScript
- 实现完整的深色/浅色模式切换功能，默认跟随系统设置
- 代码结构清晰，包含适当注释，便于理解和维护
## 响应式设计
- 页面必须在所有设备上（手机、平板、桌面）完美展示
- 针对不同屏幕尺寸优化布局和字体大小
- 确保移动端有良好的触控体验
## 媒体资源
- 使用文档中的 Markdown 图片链接（如果有的话）
- 使用文档中的视频嵌入代码（如果有的话）
## 图标与视觉元素
- 使用专业图标库如 Font Awesome 或 Material Icons（通过 CDN 引入）
- 根据内容主题选择合适的插图或图表展示数据
- 避免使用 emoji 作为主要图标
## 交互体验
- 添加适当的微交互效果提升用户体验：
* 按钮悬停时有轻微放大和颜色变化
* 卡片元素悬停时有精致的阴影和边框效果
* 页面滚动时有平滑过渡效果
* 内容区块加载时有优雅的淡入动画
## 性能优化
- 确保页面加载速度快，避免不必要的大型资源
- 实现懒加载技术用于长页面内容
## 输出要求
- 提供完整可运行的单一 HTML 文件，包含所有必要的 CSS 和 JavaScript
- 确保代码符合 W3C 标准，无错误警告
- 页面在不同浏览器中保持一致的外观和功能
请根据上传文件的内容类型（文档、数据、图片等），创建最适合展示该内容的可视化网页。

而如果再让它写一个之前我在文章里放的洛小山的弹球游戏。就确实没有那么亮眼，在游玩的时候还有一些些 BUG。

成本仅DeepSeek三分之一！阿里发布全球最强开源大模型Qwen3系列

但是毕竟这个游戏还是太复杂了，人模型的尺寸也没那么大，也没法既要又要。

如果是做稍微简单一点的连连看游戏，就还是比较简单了。

<!-- 生成一个记忆翻牌游戏，要求：
1. 使用CSS渐变背景（深紫到黑）
2. 12张圆角卡片（6对图案），默认显示彩色霓虹边框
3. 点击卡片翻转时显示emoji图案，匹配成功时卡片变为半透明发光状态
4. 顶部显示极简计时器和步数统计
5. 禁止使用图片，全部用CSS绘制 -->
<div id="memory-game" style="background: linear-gradient(135deg, #3a0ca3, #000);">
<!-- JS动态生成卡片 -->
</div>，所有的游戏文字都是英文

成本仅DeepSeek三分之一！阿里发布全球最强开源大模型Qwen3系列