大模型

开源 AI 模型挑战闭源里程碑？Meta Llama 3.1-405B 多项跑分超越 OpenAI GPT-4o

网友在 LocalLLaMA 子 Reddit 板块中发帖，分享了 4050 亿参数的 Meta Llama 3.1 信息，从该 AI 模型在几个关键 AI 基准测试的结果来看，其性能超越目前的领先者（OpenAI 的 GPT-4o）。这是开源人工智能社区的一个重要里程碑，标志着开源模型可能首次击败目前最先进的闭源 LLM 模型。如基准测试所示，Meta Llama 3.1 在 GSM8K、Hellaswag、boolq、MMLU-humanities、MMLU-other、MMLU-stem 和 winograd

7/23/2024 7:26:36 AM

故渊

番茄小说被曝要求网文作者同意将作品用于训练 AI，引发作者联合抵制

据蓝鲸新闻今晚报道，近期有不少网文作者发帖称，字节跳动网文平台“番茄小说”的签约协议中增加了“AI 训练补充协议”，要求作者同意给平台“喂”作品，用于“内容开发”。觉察到这一情况的作者前往同为字节系的“豆包”AI 进行验证，不少人通过和豆包的对话获得了自己已发表作品的故事梗概和大纲。抖音集团方对此回应称，豆包是基于公开搜索结果呈现作品及概述，不存在盗用信息行为。番茄小说对于已经签署补充协议、或签约条款中包含 AI 条款的作者，已开放相关通道，将协助作者尽快解除相关 AI 条款约定。但是故事到这并没结束。报道称，有网

7/22/2024 11:13:37 PM

清源

2024小米科技春晚，MIX Fold4、MIX Flip、SU7 Ultra Prototype等重磅亮相

SU7 开卖后雷军的第一场年度演讲，意义非凡。

7/19/2024 11:40:00 PM

机器之心

对话南洋理工大学安波教授：如何让大语言模型适应动态环境？丨IJAIRR

对人类越是简单的问题，大语言模型反而越难以做好？尽管现在的大模型已经有能力冲击数学竞赛级别的题目，但在像“9.11和9.9谁大”这样的简单问题上仍然会翻船。而从推特上网友对问题的讨论中猜测，出现这种错误的原因可能是由于大模型以token的方式来理解文字，当9.11被拆成“9”、“.”和“11”三部分时，11确实比9大。

7/18/2024 10:09:00 AM

岑大师

因监管问题，Meta 将不会在欧盟发布新的多模态 AI 模型

据 Axios 报道，Meta 在一份声明中表示，他们即将发布一个多模态的 Llama 模型，但由于监管环境的不确定性，该模型不会在欧盟发布。Meta 表示，这一决定也意味着即使在开放许可下发布，欧盟的客户和公司也无法使用多模态模型，Meta 将向欧盟的客户和公司提供仅支持文本（text only）的 Llama 3 模型。报道称，Meta 的问题不在于《人工智能法案》，而在于如何在遵守《通用数据保护条例》（GDPR）的同时，使用欧盟客户的数据来训练模型。Meta 表示使用当地数据进行训练，对于确保其产品正确反映该

7/18/2024 9:01:21 AM

沛霖（实习）

科技巨头被曝未经授权用 YouTube 内容训练 AI，苹果、英伟达在列

据 Wired 报道，包括苹果在内的一些科技巨头未经 YouTube 视频创作者同意，就使用了他们视频的字幕文件来训练人工智能模型。AI在线注意到，此次事件影响到的创作者包括知名科技博主 MKBHD (Marques Brownlee)、MrBeast、PewDiePie、以及脱口秀主持人斯蒂芬・科尔伯特、约翰・奥利弗和吉米・坎摩尔等。这些被用于训练 AI 的字幕文件相当于视频的文本转录内容。调查记者披露，一些世界上最富有的科技公司一直在利用来自成千上万个 YouTube 视频的素材来训练 AI，而这违反了 You

7/16/2024 9:47:50 PM

远洋

谷歌 Gemini 被曝今日起推出多项新功能：定制 GPT、记忆或个性化回复等

根据反向工程师 @testingcatalog 的发现，谷歌将在近期为其 Gemini 人工智能助手带来几项更新。从该工程师发布的截图来看，这一轮更新原计划在 7 月 11 日、7 月 18 日分批推送，但他又声称 7 月 11 日的更新已经推迟至 7 月 15 日（AI在线注：日期即今日，但以具体时区为准），预计当天将带来 1 项功能。而在 7 月 18 日，谷歌计划发布 4 项 Gemini 新功能。媒体 Testing Catalog 披露了近期即将发布的新功能，但未说明这些功能的具体上线日期。文生图工具 I

7/15/2024 6:02:35 PM

清源

谷歌 Gemini AI 遭质疑：未经用户同意读取 Google Drive 文档

感谢据 X 用户 @Kevin Bankston 的报告，谷歌的人工智能服务 Gemini AI 似乎在未经用户明确许可的情况下读取 Google Drive 中的私人文档。AI在线注意到，Bankston 在其推文中详细描述了这一问题。最初，他发现 Gemini 似乎在阅读他的 Google Drive 文档，但相关设置中找不到禁用该功能的选项。经进一步调查，他发现这是 Google Drive 本身的问题，而非 Google Docs，但两者可能都存在类似的漏洞。而且，根据 Gemini 人工智能的说法，用于控

7/15/2024 5:09:08 PM

远洋

模型训练成本“平民化”，前特斯拉 AI 总监 24 小时仅用 672 美元“重现”GPT-2

GPT-2 是 OpenAI 于 2019 年推出的模型，其训练费用一度为每小时 256 美元，那么 5 年过后的 GPT-4 时代，软硬件和数据的进步，是否意味着训练同一模型所需的时间和成本会随之减少呢？答案是肯定的。据 Tom's Hardware 今日报道，前特斯拉 AI 总监、OpenAI 联合创始人、项目开发者 Andrej Karpathy 使用 llm.c“重现”了 GPT-2，其成本降到了每小时仅 28 美元（AI在线备注：当前约 204 元人民币），在短短 5 年内降低了近 90%。图源 Pixa

7/13/2024 9:58:53 PM

清源

如虎添翼，谷歌探索 AI + 机器人未来：836 平方米复杂场景下指令成功率高达 90%

感谢科技媒体 The Verge 昨日报道，谷歌旗下的 DeepMind 团队正在使用 Gemini 训练其机器人，让其能够完成更复杂的任务，且能在复杂的环境下自由穿梭。DeepMind 团队已经发表了最新的研究论文，利用 Gemini 1.5 Pro 的上下文窗口（达到 200 万个词元），让用户可以更轻松地使用自然语言指令与 RT-2 机器人互动。AI在线注：上下文窗口（context window）是指语言模型在进行预测或生成文本时，所考虑的前一个词元（token）或文本片段的大小范围。其工作原理是拍摄指定区

7/13/2024 9:09:12 AM

故渊

“最强开源 AI 模型”，4050 亿参数版 Meta Llama 3 被曝 7 月 23 日发布

感谢科技媒体 The Information 本周五发布博文，援引内部员工曝料称 Meta 公司计划 7 月 23 日发布开源 AI 模型 Llama 3-405B，在现有 80 亿和 700 亿参数两个版本之外，推出 4050 亿参数版本，号称是最强大的开源大语言模型。Meta 公司今年 4 月发布 Llama 3 AI 模型时，扎克伯格就在采访中透露正在训练 4050 亿像素的密集模型，但当时没有透露太多的信息。AI在线注：上图为机翻字幕，存在错误报道称 Llama 3-405B 是一个多模态 AI 开源模型，

7/13/2024 8:09:19 AM

故渊

机器人大模型新公司！数据规模比同行大1000倍！贝索斯、孙正义等押注

机器之能报道编辑：Sia用 OpenAI 的方式颠覆机器人世界。「GPT-3 时刻正在进入机器人世界。」最近，Sequoia 合伙人 Stephanie Zhan 在投资了一家新机器人初创后说道。无论是在物流、车厂试点的人形机器人，还是四足机器狗，都要有脑子。过去，脑子要定制，「专款专用」，现在，不必了。最近，位于匹兹堡的机器人初创 Skild AI 声称，已经开发出一种通用的智能系统。它就像一个通用的智能模块，可以接入不同机器人，让他们立刻获得一些基本能力，如爬坡、跨过障碍、识别和捡起物品。7 月 9 日，Sk

7/12/2024 3:35:00 PM

机器之能

人形机器人将当上银行“大堂经理”，国内首个场景训练基地在上海浦东启用

据“上海金融官微”公众号，国内首个人形机器人银行大堂经理场景训练基地在建行上海浦东分行正式启用。银行大堂经理场景训练基地是业内首个商业银行场景应用训练基地，其首次采用开放式的创新训练模式，有助于加快提升人形机器人的能力，推动关键技术、重点产品和重点场景应用。据介绍，此次参训的机器人拥有高度仿生的躯干构型和拟人化的运动控制，结合视觉、听觉、语音等人工智能技术，科学家可以通过具身智能的推理和规划等对其进行训练。目前，该银行已对智能人形机器人开展银行大堂业务咨询、业务分流、智慧柜员机个性化操作指南、反欺诈宣传等面向客户的

7/11/2024 6:03:37 PM

清源

三星确认今年将推出 AI 升级版 Bixby，由自研大语言模型提供支持

三星确认 Bixby 将很快获得人工智能升级。在 Galaxy Z Flip 6 和 Galaxy Z Fold 6 发布后，三星移动部门 CEO TM Roh 在接受 CNBC 采访时表示，公司将在今年晚些时候发布升级版 Bixby，并由三星自家的大语言模型（LLM）提供支持。Roh 表示：“我们将通过应用生成式人工智能技术来提升 Bixby 的能力。”几个月前，三星推出过名为“Samsung Gauss”的自研 LLM。此前曾有报道称三星正在研发升级版 Bixby，但这是三星首次确认相关消息，并透露了大致发布时

7/11/2024 3:59:02 PM

远洋

Llama分子嵌入优于GPT，LLM能理解分子吗？这一局Meta赢了OpenAI

编辑 | 萝卜皮OpenAI 的 GPT 和 Meta AI 的 Llama 等大型语言模型（LLM），因其在化学信息学领域的潜力而日益受到认可，特别是在理解简化分子输入行输入系统（SMILES）方面。这些 LLM 还能够将 SMILES 字符串解码为矢量表示。加拿大温莎大学（University of Windsor）的研究人员比较了 GPT 和 Llama 与 SMILES 上的预训练模型在下游任务中嵌入 SMILES 字符串的性能，重点关注两个关键应用：分子特性预测和药物-药物相互作用预测。该研究以「Can

7/11/2024 11:51:00 AM

ScienceAI

LeCun转发，首个半导体设计开源大模型SemiKong问世，重塑芯片制造流程

编辑 | ScienceAI终于，半导体设计行业有了专属的开源大模型！7 月 9 日，国外公司 Aitomatic 宣布推出「Semi Kong」，这是世界上首个专为半导体行业设计的开源 AI 大型语言模型（LLM）。SemiKong 在 2024 年 Semicon West 展会上亮相，旨在彻底改变半导体工艺和制造技术，并有可能在未来五年内重塑价值 5000 亿美元的半导体行业。图示：LeCun 在 X 转发了 SemiKong 内容。（来源：X）Yann LeCun 在 X 转发了这条激动人心的内容：「这是专

7/10/2024 2:53:00 PM

ScienceAI

AI文档搜索公司Hebbia完成1.3亿美元融资，a16z领投；奥特曼成立AI健康公司；大模型最强架构TTT问世丨AI情报局

融资快报Hebbia 完成 1.3 亿美元融资：位于纽约的 AI 初创公司 Hebbia 宣布完成新一轮 1.3 亿美元融资，由 a16z 领投，Index Ventures、Google Ventures 以及 Peter Thiel 参投。据悉，Hebbia 目前估值约为 7 亿美元，公司成立于 2020 年，其软件可分析数字化文档和数据源，包括监管文件、PDF 以及音频和视频剪辑，以帮助客户处理比面向消费者的聊天机器人更复杂的查询，类似 Glean。旷视科技MEGVII上交所提交注册：旷视科技MEGVII以自研视觉感知算法引擎为核心，致力于持续打造在各商业领域的 AIoT 操作系统，以及深度构建具备连接百亿物联网设备能力的生态系统，为 200 多个国家和地区的数十万开发者提供智能物联服务及解决方案。

7/10/2024 11:48:00 AM

我在思考中

又遇到「GPT写的review」了？看看北大&密歇根的这个研究工作

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]本文是对发表在计算经济学顶级会议ACM Conference on Economics and Computation (EC'24)上的论文Eliciting Informative T

7/10/2024 11:27:00 AM

机器之心

资讯热榜

苹果发布全新Xcode 26开发者工具：内置ChatGPT先进AI功能那个男人回来了！Ilya现身多伦多大学毕业典礼：AI 像是用数字方式复制出来的大脑！不管你愿不愿意，AI都将深刻影响你的一生！ DeepSeek前高管秘密创业，新AI Agent项目已获顶级VC押注 ChatGPT 语音功能升级，实时翻译对话更自然流畅支持MCP！开源智能体开发框架 Rowboat：打造你的智能助手只需几分钟谷歌 Gemini 应用月下载量超越 ChatGPT，用户活跃度仍显不足长文本理解新王者?Gemini2.5Pro 击败 o3领跑 Fiction.Live 基准测试苹果 WWDC 2025:iOS 26升级视觉智能，AI 助力屏幕内容识别

标签云

人工智能 AI OpenAI AIGC 模型 ChatGPT DeepSeek AI绘画数据谷歌机器人大模型 Midjourney 用户智能开源微软 GPT 学习 Meta 图像技术 AI创作 Gemini 论文马斯克 Stable Diffusion 算法代码英伟达 Anthropic 芯片生成式开发者蛋白质腾讯神经网络研究 3D 生成训练苹果计算智能体 Sora 机器学习 AI设计 AI for Science Claude GPU AI视频人形机器人华为搜索场景百度大语言模型 xAI 预测伟达深度学习 Transformer 字节跳动 Agent 模态具身智能神器推荐 LLaMA 文本视觉 Copilot 算力工具 LLM 驾驶 API 大型语言模型应用 RAG 亚马逊