大模型

成功率提升15%，浙大、碳硅智慧用LLM进行多属性分子优化，登Nature子刊

编辑 | 萝卜皮优化候选分子的物理化学和功能特性一直是药物和材料设计中的一项关键任务。虽然人工智能很适合处理平衡多个（可能相互冲突的）优化目标的任务，但是例如多属性标记训练数据的稀疏性等技术挑战，长期以来阻碍了解决方案的开发。在最新的研究中，浙江大学侯廷军团队、中南大学曹东升团队以及碳硅智慧团队联合开发了一种分子优化工具 Prompt-MolOpt。

10/23/2024 2:06:00 PM

ScienceAI

英伟达新 nGPT 架构撬动 AI 未来：超球面学习提效，训练模型时间可缩短至 1/20

科技媒体 dataconomy 昨日（10 月 21 日）发布博文，报道称英伟达在训练 AI 模型方面取得重大突破，发布了最新的 Normalized Transformer（nGPT）新架构，保持模型的稳定性和准确性的前提下，可以将训练 AI 时间缩短至 1/4 或者 1/20。nGPT 架构提升效率的秘诀在于“超球面学习”（Hyperspherical learning）这个概念。传统的变换器模型通常缺乏一致的几何框架，而 nGPT 通过将嵌入、注意力矩阵和隐藏状态等关键组件映射到超球面表面，确保模型各层在训练过程中保持平衡。

10/22/2024 9:46:42 AM

故渊

霍尼韦尔与谷歌云合作，将生成式 AI Gemini 引入工业领域

霍尼韦尔（Honeywell）今日宣布与谷歌云（Google Cloud）进行合作，将生成式人工智能 Gemini 引入工业领域。霍尼韦尔是一家多元化高科技和制造企业，其业务涉及：航空产品和服务、楼宇、家庭和工业控制技术、汽车产品、涡轮增压器以及特殊材料等。霍尼韦尔首席执行官表示，人工智能可以帮助该公司解决劳动力短缺问题。

10/21/2024 9:19:03 PM

沛霖（实习）

把 AI 放进《我的世界》服务器：GPT-4o 杀牛宰羊，Claude3.5 把家拆了

把《我的世界》交给大模型，会怎么样？GPT-4o 鲨牛宰羊，Claude3.5 不停在人类身旁放炸药包和敌人，还把家拆了。GPT-4o mini 玩《我的世界》belike：来到游戏里面，GPT-4o mini（玩家 karolina）一开始还蛮礼貌的：你好世界！

10/21/2024 1:11:17 PM

清源

谷歌 Gemini Code Assist Enterprise 正式上线，可根据企业内部代码库生成 AI 见解

据谷歌官方新闻稿，谷歌 Gemini Code Assist Enterprise 企业 AI 现已正式上线，该 AI 工具号称可以帮助海外企业深入分析内部代码库，生成定制化的代码建议，帮助企业开发者充分利用各大谷歌云服务工具加速软件开发流程。AI在线获悉，Gemini Code Assist Enterprise 是谷歌 Gemini Code Assist 的企业定制版本，谷歌提到，标准版 Gemini Code Assist 主要侧重于根据开发者的上下文自动生成代码建议，而这一企业版主要根据企业内部的代码库生成代码建议，便于企业其他开发者维护。谷歌强调，Gemini Code Assist Enterprise 所使用的 Gemini 模型可以处理更多的上下文 Token，因此能够帮助开发者完成更复杂的任务（例如跨项目自动升级 Java 版本）。

10/19/2024 2:11:47 PM

漾仔

扎克伯格：联想基于 Meta Llama 大模型构建个人 AI 智能体 AI Now

感谢联想集团今日在美国西雅图召开年度 Tech World 大会。联想 CEO 杨元庆在主题演讲中，与 Meta 创始人兼 CEO 马克・扎克伯格一道宣布，联想与 Meta 合作基于 Llama 大模型推出面向 PC 的个人 AI 智能体 ——AI Now。扎克伯格通过视频在主题演讲上表示，联想与 Meta 已经合作多年，推出了许多卓越的创新成果，将突破性的 AI 和混合现实技术带给更多人，共同构建一个更加智能的未来。

10/16/2024 7:33:12 AM

苹果研究人员质疑 AI 的推理能力：简单数学问题稍作改动就会答错

近年来，人工智能（AI）在各个领域取得了显著的进展，其中大型语言模型（LLM）能够生成人类水平的文本，甚至在某些任务上超越人类的表现。然而，研究人员对 LLM 的推理能力提出了质疑，他们发现这些模型在解决简单的数学问题时，只要稍加改动，就会犯错误，这表明它们可能并不具备真正的逻辑推理能力。图源 Pexels周四，苹果公司的一组研究人员发布了一篇名为《理解大型语言模型中数学推理的局限性》的论文，揭示 LLM 在解决数学问题时容易受到干扰。

10/12/2024 8:51:38 AM

远洋

中国科学院团队发布GeneCompass：解析基因调控密码，打造干湿融合新范式

作者 | 中国科学院多学科交叉研究团队编辑 | ScienceAI近年来，大语言模型（LLMs）已在自然语言、计算机视觉等通用领域引发了新一轮技术革命，通过大规模语料和模型参数进行预训练，LLMs能够掌握语言的共性规律，能够对多种下游任务产生质的提升，已经形成了新的人工智能范式。在生命科学领域，单细胞组学技术的突破产生了大量不同物种细胞的基因表达谱数据，形成了海量的生命「语料」。如果把基因表达值看作单词，组合在一起构成细胞「句子」，进而形成组织「段落」和器官「文章」，并将不同物种作为生命「语种」，利用LLMs相关技

10/8/2024 2:03:00 PM

ScienceAI

Sebastian Raschka最新博客：从头开始，用Llama 2构建Llama 3.2

十天前的 Meta Connect 2024 大会上，开源领域迎来了可在边缘和移动设备上的运行的轻量级模型 Llama 3.2 1B 和 3B。两个版本都是纯文本模型，但也具备多语言文本生成和工具调用能力。Meta 表示，这些模型可让开发者构建个性化的、在设备本地上运行的通用应用 —— 这类应用将具备很强的隐私性，因为数据无需离开设备。近日，机器学习研究员 Sebastian Raschka 光速发布长篇教程《Converting Llama 2 to Llama 3.2 From Scratch》。博文链接：《

10/6/2024 7:00:00 PM

机器之心

安卓版谷歌 Gemini Live 将支持 40 多种语言，提供 AI 语音聊天功能

谷歌公司于 10 月 1 日在 X 平台发布推文，宣布 Gemini 应用现面向所有安卓用户开放 Gemini Live 功能。谷歌官方称，Gemini Live 将支持 40 多种语言，首先推出法语、德语、葡萄牙语、印地语和西班牙语，之后还会推出更多语言。谷歌 Gemini Live 将支持在同一设备上使用最多两种语言进行对话，用户如要使用 Gemini Live，设置中的第一语言必须是以下受支持的语言之一：德语（比利时）德语（德国）德语（瑞士）德语（奥地利）英语（澳大利亚）英语（印度）英语（英国）英语（美国）西

10/6/2024 6:18:28 PM

归泷（实习）

谷歌最便宜 AI 模型 Gemini 1.5 Flash 8B 将商用：腰斩击穿价 0.15 美元买百万 tokens 输出

科技媒体 NeoWin 昨日（10 月 4 日）发布博文，报道称谷歌公司即将商用 Gemini 1.5 Flash 8B 模型，成为谷歌公司最便宜的 AI 模型。AI在线曾于今年 8 月报道，谷歌公司推出 3 款 Gemini 实验性模型，其中 Gemini 1.5 Flash 8B 是 Gemini 1.5 Flash 的更小尺寸模型，拥有 80 亿参数，专为多模态任务而设计，包括大容量任务和长文本摘要任务。相比较原版 Gemini 1.5 Flash，Gemini 1.5 Flash 8B 延迟更低，特别适合聊

10/5/2024 12:40:26 PM

故渊

安卓平台吃上 AI，谷歌 Gemini Nano 轻量模型面向开发者开启测试

随着 AI 技术不断发展，移动设备上的人工智能功能正愈发重要，谷歌公司现已向安卓开发者开放 Gemini Nano 轻量 AI 模型试用，该模型主要适用于性能较低的手机 / 平板电脑，开发者现在可以使用谷歌提供的 AI Edge SDK 轻松为自家应用整合该模型。Gemini Nano 隶属 Google Gemini 模型家族，号称专为设备端轻量级任务设计，提供灵活且高效的 AI 功能，其推理任务完全在设备端完成，无需连接云端服务器，因此拥有“保障隐私”、“无需联网”、“无需订阅”三大优势。Gemini Nano

10/3/2024 9:15:31 AM

漾仔

整合海量公共数据，谷歌开源 AI 统计学专家 DataGemma

准确的统计数据、时效性强的信息，一直是大语言模型产生幻觉的重灾区。知识是现成的，但学是不可能学的。并非此身惰怠，只因现实太多阻碍。对于这个问题，谷歌在近日推出了自己筹划已久的大型数据库 Data Commons，以及在此基础上诞生的大模型 DataGemma。论文地址： Commons 是一个庞大的开源公共统计数据存储库，包含来自联合国（UN）、疾病控制与预防中心（CDC）、人口普查局、卫生部、环境机构、经济部门、非政府组织和学术机构等可信来源的大量统计数据。目前，整个语料库包含超过 2500 亿个数据点和超过 2

10/2/2024 11:06:38 PM

汪淼

安卓版谷歌 Gemini Live 上线，助力 AI 开启全民语音聊天时代

谷歌公司昨日（10 月 1 日）在 X 平台发布推文，宣布通过 Gemini 应用，现面向所有安卓用户开放 Gemini Live 功能。AI在线曾于 8 月报道，谷歌在 Pixel 9 系列手机发布会上，发布了 Gemini Live，该服务提供了一种移动对话体验，让用户和 Gemini 展开自由流畅的对话。Gemini Live 可以说是对标 OpenAI ChatGPT 最新上线的 Advanced Voice 模式，采用了增强型语音引擎，可以展开更连贯、更有情感表达力、更逼真的多轮对话。需要注意的是，目前仅

10/2/2024 9:14:09 AM

故渊

给机器人装上「虫脑」？非Transformer液态神经网络终于来了！MIT CSAIL负责人创业成果

在大模型时代，谷歌 2017 年开创性论文《Attention Is All You Need》中提出的 Transformer 已经成为主流架构。然而，刚刚一家由 MIT 计算机科学与人工智能实验室 (CSAIL) 前研究人员共同创立的初创公司 Liquid AI 却走出了不一样的路线。Liquid AI 表示他们的目标是「探索构建超越生成式预训练 Transformer (GPT) 基础模型的方法」。为了实现这一目标，Liquid AI 推出了其首批多模态 AI 模型：Liquid Foundation Mod

10/1/2024 2:20:00 PM

机器之心

谷歌安卓版 Gemini AI 现支持浮动 / 分屏操作，三星 Galaxy Z Fold6 折叠手机限时独享

科技记者 Mishaal Rahman 昨日（9 月 30 日）发布博文，报道称在三星 Galaxy Z Fold6 折叠屏手机上，通过升级最新 Gemini AI 助手应用，可以实现分屏或者浮动窗口操作。用户升级新版 Gemini 应用之后，浮动叠加层顶部有一条小白条，显示用户当前可以像常规安卓应用一样操作 Gemini，不仅支持变为浮动窗口，还支持上下、左右分屏。三星首次在其最新的 Unpacked 活动中展示了这一功能。这表明该功能可能暂时仅限于某些三星设备，Gemini 目前已知仅支持三星 Galaxy Z

10/1/2024 8:04:49 AM

故渊

端到端优化所有能力，字节跳动提出强化学习LLM Agent框架AGILE

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]

9/30/2024 2:14:00 PM

机器之心

AMD 推出自家首款小语言 AI 模型“Llama-135m ”，主打“推测解码”能力可减少 RAM 占用

AMD 在 Huggingface 平台公布了自家首款“小语言模型”AMD-Llama-135m，该模型具有推测解码功能，拥有 6700 亿个 token，采用 Apache 2.0 开源许可，AI在线附模型地址如下（点此访问）。据介绍，这款模型主打“推测解码”能力，其基本原理是使用小型草稿模型生成一组候选 token，然后由更大的目标模型进行验证。这种方法允许每次前向传递生成多个 token，而不会影响性能，从而显著减少 RAM 占用，实现效率提升。AMD 表示，这款模型在四个 AMD Instinct MI25

9/29/2024 5:08:32 PM

漾仔

资讯热榜

腾讯云大模型升级公告:DeepSeek-V3/ DeepSeek-R1模型将于24日正式下线 OpenAI低调更新GPT4o模型，多项能力反超DeepSeek 腾讯云上线DeepSeek全系API接口并打通联网搜索东风日产N7首款接入DeepSeek大模型，实现智能化人机交互 DeepSeek-R1 登顶 Hugging Face：以10000 赞力压 150 万个模型自有歪果仁为DeepSeek「辩经」：揭穿围绕DeepSeek的谣言 IBM 强化 watsonx.ai:DeepSeek-R1蒸馏版 Llama 模型上线微信搜索接入DeepSeek大模型称AI不会使用朋友圈聊天等信息

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI绘画大模型机器人数据 AI新词 Midjourney 开源 Meta 微软智能用户 GPT 学习技术智能体 Gemini 马斯克 Anthropic 英伟达图像 AI创作训练 LLM 论文代码算法苹果 AI for Science Agent Claude 腾讯芯片 Stable Diffusion 蛋白质具身智能开发者 xAI 生成式神经网络机器学习人形机器人 3D AI视频 RAG 大语言模型 Sora 研究百度生成 GPU 工具华为字节跳动计算 AGI 大型语言模型 AI设计搜索生成式AI 视频生成 DeepMind 特斯拉场景 AI模型深度学习亚马逊架构 Transformer MCP 编程 Copilot 视觉