开源

马斯克 xAI 宣布正在开源 Grok-1 模型，体量 3140 亿参数号称“全球最大”

感谢马斯克旗下 AI 初创企业 xAI 今天发布新闻稿，宣布正在开源 3140 亿参数的混合专家模型 Grok-1，该模型遵循 Apache 2.0 协议开放模型权重和架构，号称是“迄今为止全球参数量最大的开源大语言模型”。截至IT之家发稿，官方已经在 GitHub 中发布了 Grok-1 论文源代码，但还未开源模型主体。就在本月，马斯克宣布起诉 OpenAI 及其 CEO 阿尔特曼，声称 OpenAI 及其 CEO 阿尔特曼违背了公司成立的协议，该协议旨在推动 AI 技术朝着造福人类而非牟利的方向推进。马斯克对

3/18/2024 9:41:06 AM

漾仔

继起诉 OpenAI 并要求对方恢复开源后，马斯克宣布本周 xAI 将开源 Grok

感谢马斯克今日下午通过 X（推特）宣布，自家人工智能公司 xAI 将在本周内开源人工智能助手 Grok。随后，马斯克在回应网友“OpenAI 也应当如此，如果它们要像名字中的‘Open’那样”的帖子时表示，“OpenAI 就是谎言。”就在本月，马斯克宣布起诉 OpenAI 及其 CEO 阿尔特曼，声称 OpenAI 及其 CEO 阿尔特曼违背了公司成立的协议，该协议旨在推动 AI 技术朝着造福人类而非牟利的方向推进。马斯克对 OpenAI 提出了包括违反合同、违反信托义务和不公平商业行为在内的索赔，并要求该公司恢复

3/11/2024 5:01:07 PM

清源

讯飞星火V3.5正式发布，基于全国产算力平台“飞星一号”训练

1月30日，科大讯飞举行星火认知大模型V3.5升级发布会。科大讯飞董事长刘庆峰、研究院院长刘聪正式发布基于首个全国产算力训练的讯飞星火V3.5。2023年10月24日，科大讯飞携手华为，宣布首个支撑万亿参数大模型训练的万卡国产算力平台“飞星一号”正式启用。启用后的90多天里，讯飞星火基于“飞星一号”，启动了对标GPT-4的更大参数规模的大模型训练，带来了1月30日这场讯飞星火V3.5升级发布。首个基于全国产算力训练的全民开放大模型讯飞星火V3.5在语言理解、文本生成、知识问答、逻辑推理、数学能力、代码能力和多模态能

1/30/2024 8:38:00 PM

机器之心

大模型训练算力利用率达60%，蚂蚁开源分布式训练扩展库ATorch

近日，蚂蚁集团宣布开源大模型分布式训练加速扩展库ATorch。ATorch可针对不同模型和硬件资源，实现深度学习自动资源动态优化和分布式训练稳定性提升，帮助提升深度学习的智能性。据了解，在大模型训练中，ATorch千亿模型千卡级别训练的算力利用率可达60%，相当于为跑车装上了强劲的引擎。图：ATorch致力于让大模型训练更高效、可复现随着生成式大模型的爆发，模型训练的数据集和参数规模成指数级增长，要带动如此庞然大物，并且满足模型的快速迭代，分布式训练就成为了解题之道。在大模型开发工作中，很多开发者和研究人员采用Py

1/9/2024 2:04:00 PM

新闻助手

Llama 2 的入门与实战，机器之心邀请了 4 位技术大牛手把手教你

机器之能报道编辑：Sia「Llama 2 大模型算法与应用实践」-机器之心 AI 技术论坛将于 8 月 26 日在北京举办。如果要问「2023 年最火的动物是什么?」AI 圈外的人可能会回答「熊猫」，并给你列出一长串熊猫的名字。而 AI 圈内的人八成会回答「羊驼」。而且，他们也能给你列出一长串「羊驼」的名字：llama、vicuna、alpaca…… 得益于 Meta Llama 模型的开源，AI 社区的研究者对生物学羊驼属的英文单词已经如数家珍，每个单词都对应着一个（或一组）基于 Llama 的微调模型。这些模

7/30/2023 11:42:00 PM

机器之能

iPhone、Mac上都能跑，刷屏的Llama 2究竟性能如何？

昨天凌晨，相信很多人都被 Meta 发布的 Llama 2 刷了屏。OpenAI 研究科学家 Andrej Karpathy 在推特上表示，「对于人工智能和 LLM 来说，这确实是重要的一天。这是目前能够把权重提供给所有人使用的最为强大的 LLM。」

7/20/2023 2:23:00 PM

机器之心

第一个超越ChatGPT的开源模型来了？网友并不买账

开源模型真的超过 ChatGPT了吗？

7/3/2023 2:41:00 PM

机器之心

超越所有开源模型，击败 Claude、Bard，专门用于编程任务的大模型来了

开源 LLM 的性能越来越好了。

6/20/2023 2:34:00 PM

机器之心

百川智能发布开源中英文大模型，多个榜单评测成绩最佳

王小川创立的百川智能发布中英文大模型，采用开源模式，可免费商用。报道 | 机器之能2023年6月15日，被称为「中国ChatGPT梦之队」的百川智能公司，推出了70 亿参数量的中英文预训练大模型——baichuan-7B。baichuan-7B不仅在C-Eval、AGIEval和Gaokao中文权威评测榜单上，以显著优势全面超过了ChatGLM-6B等其他大模型，并且在MMLU英文权威评测榜单上，大幅领先LLaMA-7B。目前baichuan-7B大模型已在Hugging Face、Github以及Model Sc

6/15/2023 6:13:00 PM

机器之能