AIGC宇宙 AIGC宇宙

讯飞星火V3.5正式发布,基于全国产算力平台“飞星一号”训练

作者:机器之心
2024-01-30 08:38
1月30日,科大讯飞举行星火认知大模型V3.5升级发布会。科大讯飞董事长刘庆峰、研究院院长刘聪正式发布基于首个全国产算力训练的讯飞星火V3.5。2023年10月24日,科大讯飞携手华为,宣布首个支撑万亿参数大模型训练的万卡国产算力平台“飞星一号”正式启用。启用后的90多天里,讯飞星火基于“飞星一号”,启动了对标GPT-4的更大参数规模的大模型训练,带来了1月30日这场讯飞星火V3.5升级发布。首个基于全国产算力训练的全民开放大模型讯飞星火V3.5在语言理解、文本生成、知识问答、逻辑推理、数学能力、代码能力和多模态能

1月30日,科大讯飞举行星火认知大模型V3.5升级发布会。科大讯飞董事长刘庆峰、研究院院长刘聪正式发布基于首个全国产算力训练的讯飞星火V3.5。

2023年10月24日,科大讯飞携手华为,宣布首个支撑万亿参数大模型训练的万卡国产算力平台“飞星一号”正式启用。启用后的90多天里,讯飞星火基于“飞星一号”,启动了对标GPT-4的更大参数规模的大模型训练,带来了1月30日这场讯飞星火V3.5升级发布。

首个基于全国产算力训练的全民开放大模型讯飞星火V3.5在语言理解、文本生成、知识问答、逻辑推理、数学能力、代码能力和多模态能力七个方面进行了全面升级。其中语言理解、数学能力超过GPT-4 Turbo,代码达到GPT-4 Turbo 96%,多模态理解达到GPT-4V 91%。

目前,讯飞星火已赋能保险、银行、能源、汽车、通信等领域联合龙头企业,通过与太平洋保险合作,通过星火太平洋计划赋能内部知识服务、办公、审计、展业等,打造数字劳动力在保险领域的应用标杆;联合交通银行,赋能客服、展业、办公、研发等,重点打造银行领域的代码能力应用标杆;与国家能源集团联合,赋能煤炭、电力、运输、化工等方面,打造央企集团一体化联动的大模型应用标杆等。

此外,深度适配国产算力的讯飞星火开源大模型“星火开源-13B”首次发布,场景应用效果领先,昇思开源社区联合首发上线。

讯飞星火V3.5正式发布,基于全国产算力平台“飞星一号”训练

本次开源拥有130亿稠密参数(13B),包含基础模型iFlytekSpark-13B-base、精调模型iFlytekSpark-13B-chat,开源了微调工具iFlytekSpark-13B-Lora、人设定制工具iFlytekSpark-13B-Charater。学术企业研究可以基于全栈自主可控的星火优化套件,更便利地训练自己的专用大模型。

刘庆峰透露,星火开源大模型在技术上形成了差异化优势。星火开源-13B在多项知名公开评测任务中名列前茅,在文本生成、语言理解、文本改写、行业问答、机器翻译等企业典型场景中,通过对学习辅助、语言理解等领域的深入研究和优化,实用性大幅提升,在处理复杂的自然语言任务时更加得心应手。

基于“飞星一号”训练,星火开源大模型全栈国产适配优化,简单易用,场景应用效果领先,训练策略针对昇腾算力极致优化,训练效率达A100的 90%。这不仅是对昇腾AI硬件的进一步深度优化,也展示了国产算力在追赶国际先进水平方面的决心和能力。

开源只有更多的场景落地,才能更好地增进生态合作。目前,华为昇思开源社区已正式上架星火大模型开源版-13B,面对学术、企业研究完全免费,增进学术合作的同时,增进产业探索。

展望2024年讯飞星火大模型发展,刘庆峰指出三点:“首先,一定要在通用大模型的底层能力上持续对标国际最先进水平,从算法研究包括更小的算力上做出相对更优效果。”我们要清醒理智看到差距,当前在小样本快速训练、多模态深度学习训练、超复杂深度理解等领域距离GPT-4的最好水平还有差距,讯飞星火有信心在今年上半年赶上GPT-4目前最好水平。“今天的通用大模型并不一定代表人工智能的全部未来,还有很多创新要做,如脑科学互动、对抗网络的深度连接等需要整个创新的生态,但我们一定要有勇气、有期许走在最前列。”刘庆峰指出。

“第二,2024年要真正让大模型量质齐飞,不仅是行业应用,还要在很多关键技术创新上联动大模型,中国企业界、科学界有信心实现超越。”

“第三,高楼大厦要建立在安全可控的平台之上,我们要实现自主可控平台上的生态繁荣。”刘庆峰表示,自己有信心,能够实现从算法、数据、应用场景到算力,构建一个完全自主可控的繁荣的人工智能生态。

相关标签:

相关资讯

科大讯飞:讯飞星火 V4.0 正在训练中,对标 GPT-4o 的产品也在研发

科大讯飞在“深交所互动易”平台回复网友提问时透露,对标 GPT-4 当前能力的讯飞星火 V4.0 正在训练中,预计在 2024 年 6 月底发布,对标 GPT-4o 的产品正在研发中。科大讯飞方面表示,公司将紧密结合人工智能的演进和突破,把成果持续应用到智慧教育的每个产品中,不断提升产品的用户体验和客户渗透率。而在今年 4 月,科大讯飞董事长刘庆峰曾透露,今年 6 月 27 日,讯飞星火 V4.0 将正式发布。刘庆峰当时表示,星火大模型(IT之家注:讯飞星火大模型 V3.5)的通用长文本能力,包括长文档信息抽取、长
6/2/2024 4:30:06 PM
清源

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

在 6 月 27 日举办的讯飞星火 V4.0 发布会上,科大讯飞发布了讯飞星火大模型 V4.0,以及在医疗、教育、商业等多个领域的人工智能应用。讯飞星火大模型 V4.0 基于全国首个国产万卡算力集群“飞星一号”训练而成,全面提升了大模型底座的七大核心能力。整体超越 GPT-4 Turbo,特别是针对复杂指令、复杂逻辑推理、空间推理、数学、基于逻辑关系的多模理解等方面有着显著的提升。同时科大讯飞还带来了全新升级的讯飞星火 App / Desk,发布“个人空间”,打造每个人的 AI 助手。为了进一步了解讯飞星火大模型
7/5/2024 2:46:05 PM
汐元

科大讯飞星火 4.0 Turbo 大模型发布:七大能力全面超越 GPT-4 Turbo

在今日上午的 2024 科大讯飞全球 1024 开发者节上,科大讯飞正式发布“讯飞星火 4.0 Turbo”。 讯飞星火 4.0 Turbo 号称迎来全新升级,七大能力全面超越 GPT-4 Turbo,数学能力、代码能力超过 GPT-4o。 在数学能力方面,讯飞星火 4.0 Turbo 已完成超长思维链、树搜索和自我反思评价等算法验证,预计今年底可实现类 o1 的高难度数学能力。
10/24/2024 10:17:56 AM
汪淼
  • 1