AIGC宇宙 AIGC宇宙

腾讯混元新一代快思考模型 Turbo S 发布 即将在腾讯元宝中上线

作者:AI在线
2025-02-27 05:38
2025年2月27日,腾讯正式发布混元新一代快思考模型Turbo S,标志着大模型技术在响应速度和性能优化方面取得了重要突破。 与传统的慢思考模型如Deepseek R1和混元T1不同,混元Turbo S能够实现“秒回”,大幅提升输出答案的速度,吐字速度提升一倍,首字时延降低44%。 这一创新使得模型在知识、数理、创作等多个领域表现出色,为大模型的快速响应能力提供了新的解决方案。

2025年2月27日,腾讯正式发布混元新一代快思考模型Turbo S,标志着大模型技术在响应速度和性能优化方面取得了重要突破。与传统的慢思考模型如Deepseek R1和混元T1不同,混元Turbo S能够实现“秒回”,大幅提升输出答案的速度,吐字速度提升一倍,首字时延降低44%。这一创新使得模型在知识、数理、创作等多个领域表现出色,为大模型的快速响应能力提供了新的解决方案。

混元Turbo S的设计灵感来源于人类日常决策中90%~95%依赖直觉的快思考模式,与理性分析的慢思考模式相结合,为大模型提供了更智能、高效的解决问题能力。通过长短思维链的融合,该模型不仅在文科问题上保持快速体验,还显著改进了理科推理能力,整体性能大幅提升。在业界通用的多个公开Benchmark测试中,混元Turbo S展现出与DeepSeek V3、GPT4o、Claude等领先模型相当的效果。

微信截图_20250227173715.png

在架构创新方面,混元Turbo S采用了Hybrid-Mamba-Transformer融合模式,有效降低了传统Transformer结构的计算复杂度和KV-Cache缓存占用,显著降低了训练和推理成本。这一混合架构突破了传统大模型在长文训练和推理成本高的难题,发挥了Mamba架构处理长序列的优势,同时保留了Transformer捕捉复杂上下文的能力,成为工业界首次成功将Mamba架构无损应用于超大型MoE模型的案例。

作为腾讯混元系列的核心基座,混元Turbo S未来将为推理、长文、代码等衍生模型提供基础能力。基于Turbo S,腾讯还推出了具备深度思考能力的推理模型T1,该模型已在腾讯元宝全量上线,并将很快对外提供API接入服务。

目前,开发者和企业用户已可在腾讯云官网通过API调用混元Turbo S,并享受一周内免费试用的优惠。该模型的定价为输入0.8元/百万tokens,输出2元/百万tokens,相比前代混元Turbo模型大幅降价。此外,混元Turbo S也即将在腾讯元宝中逐步灰度上线,用户可在元宝内选择“Hunyuan”模型并关闭深度思考功能进行体验。

腾讯混元turbos模型API免费试用申请:https://cloud.tencent.com/apply/p/i2zophus2x8

相关标签:

相关资讯

OpenAI官方下场修复GPT-4变懒,上新多个模型、还大降价

今天,OpenAI 一口气宣布了 5 个新模型,包括两个文本嵌入模型、升级的 GPT-4 Turbo 预览版和 GPT-3.5 Turbo、一个审核模型。不知大家是否还记得,去年年底 GPT-4 开始变「懒」的事实。比如在高峰时段使用 GPT-4 或 ChatGPT API 时,响应会变得非常缓慢且敷衍,有时它会拒绝回答用户提出的问题,甚至还会单方面中断对话。 这种情况对于码农来说,更是深有体会,有人抱怨道「让 ChatGPT 扩展一些代码,它竟然让我自己去写。」原本想借助 ChatGPT 帮助自己编写代码,现在好
1/26/2024 2:41:00 PM
机器之心

加速追赶!腾讯拆分AI团队,豪掷研发资源

据央广网消息,4月29日,公司对其混元大模型研发体系进行全面重构,聚焦算力、算法和数据三大核心,调整团队部署并加大研发投入。 此次调整的核心是成立两个新的部门:大语言模型部和多模态模型部,分别负责探索前沿技术、迭代基础模型。 同时,腾讯加强了底层支撑,设立数据平台部和机器学习平台部,专注于数据管理和AI平台建设,为混元大模型的研发提供全面支持。
4/30/2025 11:00:50 AM
AI在线

腾讯混元大模型核心论文曝光:Scaling law、MoE、合成数据以及更多

随着 ChatGPT 的横空出世,大语言模型能力开始在各项领域(传统 NLP、数学、代码等)得到广泛验证,目前已经深刻影响到腾讯混元团队日常生活的方方面面。 腾讯混元团队长期致力于大语言模型的探索之路,大模型生产的各个环节开展研究创新以提升其基础能力,并将混元大模型的能力跟业务做深度结合,让生成式 AI 成为业务增长的放大器。 大语言模型的设计、训练和优化是一项复杂的系统工程,涉及到模型结构创新、训练范式优化、数据获取和评测设计、关键能力提升和挑战性问题的解决等方方面面。
11/22/2024 5:23:00 PM
新闻助手
  • 1