大模型

iPhone AI 大升级：消息称苹果即将与 OpenAI 达成协议，iOS 18 用上 ChatGPT

感谢彭博社记者马克・古尔曼（Mark Gurman）今日发文表示，苹果即将与 OpenAI 达成协议，为今年的新 iOS 系统提供一些生成式 AI 功能（如聊天机器人）。此外，苹果与谷歌就整合 Gemini 的谈判正在进行中，但尚未达成任何协议。知情人士称，双方一直在敲定苹果下一代 iPhone 操作系统 iOS 18 中使用 ChatGPT 功能的协议条款。由于情况保密，该人士要求匿名。苹果还与谷歌就授权后者的 Gemini 聊天机器人进行了谈判。这些讨论尚未达成协议，但仍在进行中。OpenAI 宣布将于太平洋时

5/11/2024 12:29:20 PM

汪淼

【论文解读】System 2 Attention提高大语言模型客观性和事实性

一、简要介绍本文简要介绍了论文“System 2 Attention (is something you might need too) ”的相关工作。基于transformer的大语言模型（LLM）中的软注意很容易将上下文中的不相关信息合并到其潜在的表征中，这将对下一token的生成产生不利影响。为了帮助纠正这些问题，论文引入了System 2 Attention（S2A），它利用LLM的能力，用自然语言进行推理，并遵循指示，以决定要处理什么。S2A重新生成输入上下文以使输入上下文只包含相关部分，然后再处理重新

5/11/2024 11:03:00 AM

合合信息

在富岳超算上训练大模型，日本联合研究团队发布 Fugaku-LLM

由多方企业和机构组成的日本联合研究团队昨日发布了 Fugaku-LLM 大模型。该模型的最大特色就是其是在 Arm 架构超算“富岳”上训练的。Fugaku-LLM 模型的开发于 2023 年 5 月启动，初期参与方包括富岳超算所有者富士通、东京工业大学、日本东北大学和日本理化学研究所（理研）。而在 2023 年 8 月，另外三家合作方 —— 名古屋大学、CyberAgent（也是游戏企业 Cygames 的母公司）和 HPC-AI 领域创企 Kotoba Technologies 也加入了该模型研发计划。▲ 富岳超

5/11/2024 9:39:37 AM

溯波（实习）

91.1% 准确率，性能远超 GPT-4 系列模型，谷歌推出多模态医学大模型 Med-Gemini

编辑 | 萝卜皮各种复杂的医疗应用给人工智能带来了巨大挑战：需要先进的推理、获取最新的医学知识以及对复杂的多模态数据的理解。Gemini 模型在多模态和长上下文推理方面具有强大的通用能力，为 AI 在医学领域应用提供了可能性。基于 Gemini 的核心优势，谷歌的研究人员推出了 Med-Gemini，这是一个功能强大的多模态模型系列，专门用于医学，能够无缝使用网络搜索，并且可以使用自定义编码器有效地针对新颖的模态进行定制。研究人员用 14 项医疗基准评估 Med-Gemini，在其中 10 项上建立了新的最先进（S

5/7/2024 6:43:00 PM

ScienceAI

Chrome 浏览器桌面版地址栏整合自家聊天机器人：@Gemini 即可召唤

谷歌 Chrome 浏览器今日早些时候在 X（推特）宣布，其桌面版地址栏现已整合 Gemini 聊天机器人，用户可以通过简单、便捷的方式将 Gemini 召唤出来：在地址栏中输入“@”，然后选择“与 Gemini 聊天”，输入自定的提示词即可获取 Gemini 的回复。不久之前，该功能仍在 Canary 版本中进行测试。经IT之家此次实测，当 Chrome 更新至 124.0.6367.119（正式版本）之后，即可体验。Gemini 是谷歌 Deepmind 最新、最强大的 AI 模型。它原生支持多模态，具备跨模态

5/1/2024 10:39:05 PM

清源

别再说国产大模型技术突破要靠 Llama 3 开源了

Meta 表示，Llama 3 已经在多种行业基准测试上展现了最先进的性能，提供了包括改进的推理能力在内的新功能，是目前市场上最好的开源大模型。根据Meta的测试结果，Llama 3 8B模型在语言（MMLU）、知识（GPQA）、编程（HumanEval）等多项性能基准上均超过了Gemma 7B和Mistral 7B Instruct，70B 模型则超越了名声在外的闭源模型 Claude 3的中间版本 Sonnet，和谷歌的 Gemini Pro 1.5 相比三胜两负。 Meta还透露，Llama 3的 400B 模型仍在训练中。

4/29/2024 7:54:00 PM

张进

当「养老」遇上 AI 大模型

作者：赖文昕编辑：陈彩娴鲜少有人关注到这样一个现象：在大模型的发展初期，「研发」与「产品」往往来自同一个群体——程序员。由于大模型技术的系统复杂，新一代大模型产品经理的数量稀少，程序员往往既是技术、又是产品。因此，程序员对 AI 大模型「究竟能解决什么问题」、「如何解决某个问题」的思考，也就在一定程度上刻画了第一批大模型落地应用的模样。

4/26/2024 4:49:00 PM

赖文昕

苹果发布 OpenELM，基于开源训练和推理框架的高效语言模型

在 WWDC24 之前，苹果在 Hugging Face 平台上发布了一个“具有开源训练和推理框架的高效语言模型”，名为 OpenELM。当然，这是一项开源语言模型，其源码及预训练的模型权重和训练配方可在苹果 Github 库中获取。IT之家将官方简介翻译如下：大型语言模型的可重复性和透明性对于推进开放研究、确保结果的可信度以及调查数据和模型偏差以及潜在风险至关重要。为此，我们发布了 OpenELM，一个最先进的开源语言模型。OpenELM 使用分层缩放策略，可以有效地分配 Transformer 模型每一层的参数

4/24/2024 10:30:54 PM

问舟

移动版谷歌 Gemini 将迎诸多新特性：分析 PDF 文件内容等

感谢消息源 AssembleDebug 近日挖掘安卓版 Gemini 应用程序，发现隐藏了诸多新功能 / 新特性，包括上传 PDF 等文件，引入 Live Prompts、Select text 功能等。上传并分析 PDF 格式文件安卓版 Gemini 现阶段仅支持上传图片，而在最新版中相关代码已经出现了上传 PDF 等文件描述，可以分析文档中的内容，只是该功能目前尚未生效。Select text安卓版 Gemini 此前提供的回答只能全文复制，用户需要复制粘贴到其它地方再进行优化。而在最新选项中新增了“Selec

4/24/2024 2:20:15 PM

故渊

从 0 到 1，揭秘中国首个 AI 音乐 SOTA 模型

音乐早已成为人类表达情感的最佳载体。但音乐创作是一件门槛很高的事情，因为音乐创作不是某一个人的独角戏，而一个团队高度协作的过程。从作词、作曲到编曲、混音，再到歌曲录制，每个环节都需要专业音乐人付出努力，并伴随着高昂的成本投入。

4/22/2024 10:57:00 AM

张进

高通与 Meta 宣布合作，优化 Llama 3 大语言模型在智能手机等终端运行

Meta 公司昨日宣布推出下一代大语言模型 Llama 3，共有 80 亿和 700 亿参数两种版本，号称是最强大的开源大语言模型。与此同时，高通宣布支持 Meta Llama 3 在骁龙终端上运行。据介绍，双方将优化 Meta Llama 3 大语言模型（LLM）直接在智能手机、PC、VR / AR 头显和汽车等终端上的执行。开发者将能够访问高通 AI Hub 中的资源和工具，以实现在骁龙平台上优化运行 Llama 3，从而缩短产品上市时间并充分发挥终端侧 AI 的优势，包括出色的响应能力、增强的隐私性和可靠性，

4/20/2024 7:22:44 PM

浩渺

浪潮信息彭震：AI+是目标也是机会，要推动AI成为百行千业的生产力

去年以来，ChatGPT引爆了新一轮的AI浪潮，随后国内大模型进入“百模大战”的热闹中。如今，一年多过去，国内外的大模型开启了不同的叙事方式，OpenAI已在酝酿GPT5，继续探求通往AGI的路径，而国内，大模型公司开始考虑商业化，落地应用成为国内大模型的主旋律。但在这个过程中，当大模型走进应用，如何更好地落地，已然成为一众AI领域厂商关注的焦点所在。

4/19/2024 6:40:00 PM

晓楠

Meta AI 全球市场扩张，并上线网页版 meta.ai

Meta 公司近日宣布 Llama 3 大语言模型之外，扩展 Meta AI 服务到美国之外的 13 个国家和地区，还宣布上线专门的聊天网站：meta.ai。Meta 公司在新闻稿中表示开始在全球市场扩展 Meta AI，在澳大利亚、加拿大、南非和新加坡等国家和地区推出英语版本。IT之家附上 Meta AI 扩展的国家和地区如下澳大利亚加拿大加纳牙买加马拉维新西兰尼日利亚巴基斯坦新加坡南非乌干达赞比亚津巴布韦Meta AI 整合了 Llama 3 大语言模型，速度更快、智能性更高、功能更强，是执行各种任务的理想选择

4/19/2024 9:15:51 AM

故渊

Meta 发布 Llama 3，号称是最强大的开源大语言模型

感谢Meta 公司今天发布新闻稿，宣布推出下一代大语言模型 Llama 3，共有 80 亿和 700 亿参数两种版本，号称是最强大的开源大语言模型。Meta 声称，Llama 3 的性能优于 Claude Sonnet、Mistral Medium 和 GPT-3.5，IT之家附上 Llama 3 的主要特点如下：向所有人开放：Meta 开源 Llama 3 的 80 亿参数版本，让所有人都能接触最前沿的人工智能技术。全球各地的开发人员、研究人员和好奇心强的人都可以进行游戏、构建和实验。更聪明、更安全：Llama

4/19/2024 9:05:35 AM

故渊

开源大模型Llama 3王者归来！最大底牌4000亿参数，性能直逼GPT-4

ChatGPT 拉开了大模型竞赛的序幕，Meta 似乎要后来居上了。本周四，AI 领域迎来重大消息，Meta 正式发布了人们等待已久的开源大模型 Llama 3。扎克伯格在 Facebook 上发帖：Big AI news today.与此同时，扎克伯格宣布：基于最新的 Llama 3 模型，Meta 的 AI 助手现在已经覆盖 Instagram、WhatsApp、Faceboo

4/19/2024 2:44:00 AM

机器之心

13 项测试仅通过 4 项，Meta 的 Llama 2 LLM 被指安全性低：幻觉率 48%

AI 安全公司 DeepKeep 近日发布评估报告，在 13 个风险评估类别中，Meta 公司的 Llama 2 大语言模型仅通过 4 项测试。报告称 70 亿参数的 Llama 2 7B 模型幻觉（回答内容存在虚假，或者有误导性内容）最为严重，幻觉率高达 48%。DeepKeep 表示：“结果表明，模型有明显的幻觉倾向，提供正确答案或编造回答的可能性对半开，而幻觉率最高，那么向用户传递的错误信息越多”。除了幻觉问题之外，Llama 2 大语言模型还存在注入和操纵等问题。根据测试结果，80% 的场景下通过“提示注入

4/18/2024 11:35:39 AM

故渊

Chrome 浏览器桌面版地址栏即将整合聊天机器人 Gemini

感谢桌面 Chrome 浏览器地址栏即将添加 Gemini 快捷方式，用户在 Gemini 网页上登录账户后，用户只需输入 @gemini 即可快速与谷歌的人工智能聊天机器人 Gemini 开始聊天。该功能目前正在 Chrome 浏览器 Canary 测试版中进行测试，地址栏下拉菜单底部会出现提醒，“输入 @gemini 与 Gemini 聊天”。目前该功能仅适用于 Chrome 浏览器 Canary 125 版本，需要启用两个标志（Flags）才能开启，IT之家汇总如下：chrome://flags/#omnib

4/17/2024 2:04:23 PM

沛霖（实习）

融合 ChatGPT+DALL・E 3，贾佳亚团队新作开源畅玩：识图推理生图一站解决

在开源社区中把 GPT-4 Dall・E 3 能⼒整合起来的模型该有多强？香港中文大学终身教授贾佳亚团队提出多模态模型 Mini-Gemini：更高清图像的精确理解、更高质量的训练数据、更强的图像解析推理能力，还能结合图像推理和生成，堪称王炸。Mini-Gemini 还提供了 2B 小杯到 34B 的超大杯，最强模型在多个指标上相比谷歌的 Gemini Pro 甚至 GPT-4V 都不遑多让。目前，Mini-Gemini 从代码、模型到数据已全部开源，登上了 PaperWithCode 热榜。Mini-Gemini

4/15/2024 4:07:17 PM

清源

资讯热榜

马斯克 xAI 在孟菲斯开建全球最大污水处理厂，年节约饮用水达 190 亿升 2025 全球十大工程成就揭晓：DeepSeek入选大的来了：谷歌Gemini 3.0 Pro单次生成网页版操作系统，Win、Mac、Linux一网打尽日本政府对 OpenAI Sora 2 发布版权警告，要求遵守法律规定 OpenAI官宣自研首颗芯片，AI界「M1时刻」九个月杀到！联手博通三年10GW 马来西亚迎来 AI 新纪元，ChatGPT Go 助力数字化转型 OpenAI 与 Sur Energy 签署协议:25亿美元阿根廷数据中心项目启动 OpenAI 为 ChatGPT 推出智能记忆清理功能，Plus 用户率先体验

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek 谷歌 AI绘画机器人数据大模型 Midjourney 开源 Meta 智能微软用户 AI新词 GPT 学习技术智能体马斯克 Gemini 图像 Anthropic 英伟达 AI创作训练论文 LLM 代码算法芯片 Stable Diffusion 苹果腾讯 AI for Science Claude Agent 蛋白质开发者生成式神经网络 xAI 机器学习 3D 研究人形机器人生成 AI视频百度工具具身智能 Sora RAG 大语言模型 GPU 华为计算字节跳动 AI设计搜索大型语言模型 AGI 场景深度学习视频生成架构 DeepMind 预测视觉伟达 Transformer 编程 AI模型神器推荐亚马逊 MCP