大模型

美国加州通过人工智能训练数据透明度法案，要求企业披露 AI 模型数据来源

今日，美国加州立法机构通过了一项颇具争议的法案 —— 人工智能训练数据透明度法案，该法案将提交给州长加文・纽瑟姆，但其尚未对此法案表态。图源 Pexels该法案旨在要求人工智能公司在开发和训练模型时，对其使用的数据集进行更加透明的披露。AI在线注意到，这项由议员雅克・欧文提出的法案（AB 2013）原本适用范围更广，但在 8 月 20 日范围缩小至仅适用于生成式人工智能，即能生成文本、图像和类似内容的人工智能，例如 Open AI 的 ChatGPT 这类。该法案要求人工智能公司公开其训练模型的关键信息，如数据来源

8/28/2024 2:35:06 PM

远洋

谷歌发布 3 款 Gemini 实验 AI 模型：1.5 Pro 冲榜第二、1.5 Flash 从第 23 蹿升至第 6

谷歌 AI Studio 产品总监洛根・基尔帕特里克（Logan Kilpatrick）今天（8 月 28 日）在 X 平台发布推文，宣布推出 3 款 Gemini 实验性模型。AI在线附上谷歌本次推出的 3 款实验性 Gemini AI 模型如下：Gemini 1.5 Flash-8BGemini 1.5 Flash-8B 是 Gemini 1.5 Flash 的更小尺寸模型，拥有 80 亿参数，专为多模态任务而设计，包括大容量任务和长文本摘要任务。Gemini 1.5 Pro Exp-0827主要增强编程、复杂

8/28/2024 11:02:41 AM

故渊

分子大模型升级，Uni-Mol+加速量子化学属性预测，深势科技、北大研究登Nature子刊

编辑 | KXUni-Mol 是深势科技于 2022 年发布的一款基于分子三维结构的通用大模型，其性能优越、模型泛化能力强，在小分子性质预测、蛋白靶点预测、量子化学性质预测、MOF 材料吸附性能预测等任务上都超越了现有的解决方案。今年 3 月，深势科技与清华大学等合作，提出基于 Uni-Mol 的领域专属模型 Uni-MOF，用于预测各类工况下纳米多孔材料对各类气体的吸附性能，预测精度高达 0.98。近日，深势科技与北京大学合作，推出新一代模型 Uni-Mol ，迭代升级后的模型拥有更大的参数量，更多的预训练数据量

8/27/2024 3:13:00 PM

ScienceAI

程序员为何容易爱上 AI？MIT 学者研究：「智性恋」浓度过高

OpenAI 警告说，跟人工智能语音聊天可能会产生「情感依赖」。这种情感依赖是怎么产生的呢？MIT 的一项研究指出，这可能是「求仁得仁」的结果，无怪乎连软件工程师也会对 AI 着迷。「请不要爱上我们的人工智能聊天机器人。」这个月，OpenAI 在发布的官方报告中，特意提到，不希望用户与 ChatGPT-4o 建立情感联系。OpenAI 的这种担心并不是多余的，对一百万个 ChatGPT 交互日志的分析表明，AI 的第二大流行用途居然是性角色扮演。论文地址： AI 伴侣上瘾的不仅包括对技术不甚了解的普通用户，连软件工

8/24/2024 1:34:53 PM

清源

摩尔线程开源音频理解大模型 MooER：基于国产全功能 GPU 训练和推理

摩尔线程开源了音频理解大模型 —MooER（摩耳），是业界首个基于国产全功能 GPU 进行训练和推理的大型开源语音模型。基于摩尔线程夸娥（KUAE）智算平台，MooER 大模型用 38 小时完成了 5000 小时音频数据和伪标签的训练。MooER 不仅支持中文和英文的语音识别，还具备中译英的语音翻译能力。在 Covost2 中译英测试集中，MooER-5K 取得了 25.2 的 BLEU 分数，接近工业级效果。摩尔线程 AI 团队在该工作中开源了推理代码和 5000 小时数据训练的模型，并计划进一步开源训练代码和基

8/23/2024 6:21:35 PM

沛霖（实习）

讲座预约丨四位专家大论道：大模型时代的强化学习丨GAIR live

站在科技创新的浪潮之巅，我们见证了人工智能领域的巨大飞跃，尤其是大模型技术与强化学习中的结合和突破性应用，正在引领我们进入一个全新的智能时代。在过去几年中，强化学习作为人工智能的一个重要分支，已经从理论研究的深奥殿堂走向了实践应用的广阔天地，从实验室的封闭空间走向了我们日常生活的各个角落。在自动驾驶、游戏AI、机器人控制等领域，强化学习的身影无处不在，它们正逐步成为我们生活中不可分割的一部分。

8/23/2024 11:43:00 AM

岑大师

明确了：文本数据中加点代码，训练出的大模型更强、更通用

代码知识原来这么重要。如今说起大语言模型（LLM），写代码能力恐怕是「君子六艺」必不可少的一项。在预训练数据集中包含代码，即使对于并非专门为代码设计的大模型来说，也已是必不可少的事。虽然从业者们普遍认为代码数据在通用 LLM 的性能中起着至关重要的作用，但分析代码对非代码任务的精确影响的工作却非常有限。在最近由 Cohere 等机构提交的一项工作中，研究者系统地研究了代码数据对通用大模型性能的影响。论文链接：「预训练中使用的代码数据对代码生成以外的各种下游任务有何影响」。作者对范围广泛的自然语言推理任务、世界知识任

8/22/2024 6:20:00 PM

机器之心

发布三个月，豆包大模型综合能力提升20.3%，应用落地再提速

8月21日，火山引擎AI创新巡展在来到上海。此次巡展会，火山引擎发布了豆包大模型的一系列产品升级，并携手多点 DMALL 成立零售大模型生态联盟。火山引擎总裁谭待表示，较3个月前，最新版豆包大语言模型的综合能力提升了20.3%，在智源、上海AI Lab等权威机构的多项评测中位列榜首。

8/21/2024 11:15:00 PM

代聪飞

Meta 部署新网络爬虫机器人，为其 AI 模型收集大量数据

北京时间 8 月 21 日，近日，Meta 悄悄地发布了一款新的网络爬虫，用于搜索互联网并收集大量数据，为其人工智能模型提供支持。据三家追踪网络抓取器的公司称，Meta 新网络爬虫机器人 Meta External Agent 于上月推出，类似于 OpenAI 的 GPTBot，可以抓取网络上的人工智能训练数据，例如新闻文章中的文本或在线讨论组中的对话。根据使用档案历史记录显示，Meta 确实在 7 月底更新了一个面向开发者的公司网站，其中一个标签显示了新爬虫的存在，但 Meta 至今还没有公开宣布其新爬虫机器人。

8/21/2024 1:10:05 PM

余青

AI在用 | AI卷起「穷鬼健身」，15天涨粉上万

机器之能报道编辑：杨文以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式，但绝大部分人依然不知道该如何使用。因此，我们推出了「AI在用」专栏，通过直观、有趣且简洁的人工智能使用案例，来具体介绍AI使用方法，并激发大家思考。我们也欢迎读者投稿亲自实践的创新型用例。投稿邮箱：[email protected]日本国民女神天海佑希有句名言：男人会背叛你，但肌肉不会。网友纷纷评论：女王发言、人间清醒……视频链接：，健身圈也卷到不行。什么直角肩、马甲线、双开门…… 为了练出好身材，年轻人们拼了

8/19/2024 5:41:00 PM

机器之能

Nature子刊，上智院、复旦、中国气象局研发次季节AI大模型「伏羲」，突破「可预报性沙漠」

编辑 | ScienceAI作者 | 伏羲团队国务院印发的《气象高质量发展纲要（2022—2035 年）》明确提出要「提前一个月预报重大天气过程」，而这离不开 15 天以上的次季节气候预测技术。次季节气候预测关注的是未来 15~60 天的气候异常，可以为农业、水利、能源等领域的生产安排提供重要支撑。相比时效在两周以内的中短期天气预报，次季节气候预测的不确定性更大。它不仅需要考虑初值问题，还要考虑边界强迫的影响，预测来源更为复杂，预测技巧也较少。因此，次季节气候预测一直被称为「可预报性沙漠」，由于其复杂性，甚至连 A

8/19/2024 2:37:00 PM

ScienceAI

小而强，英伟达剪枝、蒸馏出 Llama-3.1-Minitron 4B AI 模型

英伟达公司联合 Meta 公司发布了最新的 Llama-3.1-Minitron 4B AI 模型，主要通过结构化权重剪枝、知识提炼等尖端技术，成功蒸馏（Distill）出 40 亿参数的“小而强”模型。图源：英伟达Llama-3.1-Minitron 4B 模型在 Llama-3.1-Minitron 8B 基础上蒸馏而来，英伟达在深度和宽度方向上使用了结构化剪枝技术。AI在线注：剪枝是一种删除网络中不那么重要的层或神经元的技术，保留其性能的情况下，目的是减小模型的大小和复杂度。英伟达通过从模型中删除 16 层来

8/17/2024 7:21:02 AM

故渊

Nature 曝惊人内幕：论文被天价卖出喂 AI，作者 0 收入

Nature 的一篇文章透露：你发过的 paper，很可能已经被拿去训练模型了！有的出版商靠卖数据，已经狂赚 2300 万美元。然而辛辛苦苦码论文的作者们，却拿不到一分钱，这合理吗？全球数据告急，怎么办？论文来凑！最近，Nature 的一篇文章向我们揭露了这样一个事实：连科研论文，都被薅去训 AI 了……据悉，很多学术出版商，已经向科技公司授权访问自家的论文，用来训练 AI 模型。一篇论文从酝酿 idea 到成稿，包含了多少作者日日夜夜的心血，如今很可能在不知情的情况下，就成为训 AI 的数据。这合理吗？更可气的是

8/15/2024 12:53:16 PM

汪淼

古尔曼：苹果在 AI 领域至少落后谷歌两到三年

昨天谷歌提前召开新品发布会，抢在苹果 iPhone 16 系列发布前展示了 Pixel 9 系列搭载的全新 AI 功能，引发业内广泛关注。彭博社记者马克・古尔曼称，苹果在 AI 技术方面至少落后谷歌两三年。谷歌在本次发布会上全面展示了 Gemini AI 的强大功能，将其深度整合到了 Android 和 Pixel 手机中。相比之下，苹果虽然在 WWDC 上公布了 Apple Intelligence，但实际应用尚不成熟，消息称部分功能甚至无法在 iPhone 16 发布时及时推出。此外，谷歌还强调 Gemini

8/15/2024 11:05:38 AM

远洋

AI在用 | 穿越了！3款AI工具让梵高、莫扎特们「活」在当下

机器之能报道编辑：杨文以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式，但绝大部分人依然不知道该如何使用。因此，我们推出了「AI在用」专栏，通过直观、有趣且简洁的人工智能使用案例，来具体介绍AI使用方法，并激发大家思考。我们也欢迎读者投稿亲自实践的创新型用例。最近，有博主将一堆世界名人的自画像制成了动画，吸引了不少网友围观。例如，文森特・梵高略带忧郁地抚摸着红色的络腮胡子：一副贵族气质的莫扎特摆弄起礼服：写出《傲慢与偏见》的简・奥斯汀坐在椅子上露出微笑：贝多芬忘我地拉着小提琴：还有达芬

8/14/2024 5:04:00 PM

机器之能

谷歌版 Her 大翻车：试了 3 次且换手机才成功… 网友：我手动只需 10 秒

翻车，大翻车。就在今天凌晨，谷歌版 Her——Gemini Live 正式发布。毕竟明显是对标 OpenAI 家的 GPT-4o，可以说是吸足了科技圈的眼球。在官网发布的 demo 中，拍照问答功能的效果是这样的：它大致实现的功能，是用手机拍摄演唱会的海报，并让 Gemini 查看用户的日历，看看行程是否适合参加。以及还可以基于此进行一系列后续的操作，包括定时间查票价等等。然而…… 当来到发布会现场演示环节的时候，画风却 180° 大变样。请看 VCR：第一次：失败了。第二次：失败了。第三次：换手机，成功了。嗯…

8/14/2024 12:26:03 PM

清源

谷歌发布 Gemini Live：支持 AI 语音聊天，可模拟面试场景、推荐演讲技巧

谷歌在今天召开的 Pixel 9 系列手机发布会上，发布了 Gemini Live 服务，将于今天开始率先面向使用英语的 Gemini Advanced 订阅用户开放。推动自然、流畅的对话交流谷歌表示 Gemini Live 提供了一种移动对话体验，让用户和 Gemini 展开自由流畅的对话。Gemini Live 可以说是对标 OpenAI ChatGPT 最新上线的 Advanced Voice 模式（限量 Alpha 测试），采用了增强型语音引擎，可以展开更连贯、更有情感表达力、更逼真的多轮对话。谷歌表示用

8/14/2024 3:02:04 AM

故渊

最强 AI 程序员 Genie 砸饭碗：84 秒跑通代码，像人一样思考，团队仅 5 人

继 Devin 之后，又一个 AI 软件工程师被刷屏了 —— 它叫 Genie，号称目前地表最强，已经可以像人一样思考和行动了！那么这个“地表最强”，到底强到什么程度？先来看下评测分数。在权威榜单 SWE-Bench 中，Genie 以解决了 30.07% 问题的成绩夺得榜首。（SWE-Bench 是一个用来评估大模型解决现实中软件问题的基准。）而这个成绩可谓是遥遥领先第二名 19.27%，解锁了提升 SOTA 的最大增幅 —— 57%！至于 Genie 的实际效果，用团队的话来说就是：它可以做到像人类工程师一样解

8/13/2024 2:00:40 PM

汪淼

资讯热榜

苹果发布全新Xcode 26开发者工具：内置ChatGPT先进AI功能那个男人回来了！Ilya现身多伦多大学毕业典礼：AI 像是用数字方式复制出来的大脑！不管你愿不愿意，AI都将深刻影响你的一生！ DeepSeek前高管秘密创业，新AI Agent项目已获顶级VC押注 ChatGPT 语音功能升级，实时翻译对话更自然流畅支持MCP！开源智能体开发框架 Rowboat：打造你的智能助手只需几分钟谷歌 Gemini 应用月下载量超越 ChatGPT，用户活跃度仍显不足长文本理解新王者?Gemini2.5Pro 击败 o3领跑 Fiction.Live 基准测试苹果 WWDC 2025:iOS 26升级视觉智能，AI 助力屏幕内容识别

标签云

人工智能 AI OpenAI AIGC 模型 ChatGPT DeepSeek AI绘画数据谷歌机器人大模型 Midjourney 用户智能开源微软 GPT 学习 Meta 图像技术 AI创作 Gemini 论文马斯克 Stable Diffusion 算法代码英伟达 Anthropic 芯片生成式开发者蛋白质腾讯神经网络研究 3D 生成训练苹果计算智能体 Sora 机器学习 AI设计 AI for Science Claude GPU AI视频人形机器人华为搜索场景百度大语言模型 xAI 预测伟达深度学习 Transformer 字节跳动 Agent 模态具身智能神器推荐 LLaMA 文本视觉 Copilot 算力工具 LLM 驾驶 API 大型语言模型应用 RAG 亚马逊

大模型