大模型

消息称谷歌借助 AI 探索商业模式变革，将为苹果 iPhone 用户提供付费 Gemini AI 技能

感谢谷歌正在积极探索生成式 AI-- Gemini 的变现方式，而提供付费高级功能显然是不错的选择。IT之家援引 Financial Times 报道，谷歌将为苹果 iOS 18 用户提供各种付费 AI 功能。消息称苹果目前正和谷歌等多家 AI 公司合作，会在 iOS 18 系统中开辟 AI Store 应用商店，用户可以通过支付相关费用，解锁更多 AI 技能。谷歌也在探索广告之外的其它营收方式，通过在苹果 iPhone 中扩展 Gemini 服务，积极扩充生成式 AI 的诸多付费技能，只是现阶段谷歌的这种变现渠道

4/4/2024 8:12:01 AM

故渊

Anthropic 用 256 轮对话「灌醉」大模型，Claude 被骗造出炸弹

【新智元导读】Anthropic 发现了大模型的惊人漏洞。经过 256 轮对话后，Claude 2 逐渐被「灌醉」，开始疯狂越狱，帮人类造出炸弹！谁能想到，它的超长上下文，反而成了软肋。大模型又被曝出安全问题？这次是长上下文窗口的锅！今天，Anthropic 发表了自己的最新研究：如何绕过 LLM 的安全限制？一次越狱不够，那就多来几次！论文地址： Claude3 一家叫板 OpenAI 之余，Anthropic 仍然不忘初心，时刻关注着他的安全问题。一般情况下，如果我们直接向 LLM 提出一个有害的问题，LLM

4/3/2024 1:36:17 PM

清源

谷歌：手机运行人工智能模型将占用大量内存

谷歌在 3 月初发布了一个奇怪的声明，称旗下两款新手机 Pixel 8 和 Pixel 8 Pro 中，只有 Pixel 8 Pro 能够运行其最新的人工智能模型“Google Gemini”。尽管两款手机的配置非常相似，但谷歌却以神秘的“硬件限制”为由拒绝在 Pixel 8 上运行该模型。这番言论让人费解，因为谷歌一直宣称 Pixel 8 是以人工智能为核心的手机，并且还专门针对智能手机设计了“Gemini Nano”模型，然而这两者居然无法兼容运行。几周后，谷歌似乎开始松口，宣布即将在 6 月的季度更新中为 P

3/31/2024 12:08:38 PM

远洋

号称全球最强开源 AI 模型，DBRX 登场：1320 亿参数，语言理解、编程能力等均超 GPT-3.5

初创公司 Databricks 近日发布公告，推出了开源 AI 模型 DBRX，声称是迄今为止全球最强大的开源大型语言模型，比 Meta 的 Llama 2 更为强大。DBRX 采用 transformer 架构，包含 1320 亿参数，共 16 个专家网络组成，每次推理使用其中的 4 个专家网络，激活 360 亿参数。Databricks 在公司博客文章中介绍，在语言理解、编程、数学和逻辑方面，对比 Meta 公司的 Llama 2-70B、法国 Mistral AI 公司的 Mixtral 以及马斯克旗下 xA

3/28/2024 7:57:39 AM

故渊

谁将替代 Transformer？

Transformer 由于其处理局部和长程依赖关系的能力以及可并行化训练的特点，一经问世，逐步取代了过去的 RNN（循环神经网络）与 CNN（卷积神经网络），成为 NLP（自然语言处理）前沿研究的标准范式。今天主流的 AI 模型和产品——OpenAI 的ChatGPT、谷歌的 Bard、Anthropic 的 Claude，Midjourney、Sora到国内智谱 AI 的 ChatGLM 大模型、百川智能的 Baichuan 大模型、Kimi chat 等等——都是基于Transformer 架构。 Transformer 已然代表了当今人工智能技术无可争议的黄金标准，其主导地位至今无人能撼动。

3/27/2024 7:06:00 PM

张进

手机大模型崛起：荣米 OV 的战场厮杀

作者丨郭思编辑丨陈彩娴数据显示，2023年全球智能手机出货量同比下滑3.2%，总数仅为11.7亿部。手机市场的饱和，早已是行业共识。尽管如此，智能手机作为主流的通讯和娱乐工具，业界人士表示，其地位在未来五年内不太可能被迅速替代。

3/27/2024 2:05:00 PM

郭思

网友反馈微软 Copilot 引用谷歌 Gemini 内容，点击链接无法跳转指定内容页面

Reddit 网友近日发布帖子，表示微软旗下的 Copilot 在其参考信息中，引用了来自谷歌 Gemini 的数据。用户反馈这就导致了混乱，点击 Copilot 中的链接，并不会跳转到 Copilot 引用的指定信息内容，而是会跳转到 Gemini 的主页。IT之家附上截图如下：用户对此的反应不一，有些人的观点认为：Copilot 应该只能引用来自 Bing 搜索的内容，不应该和 Gemini 等其它聊天机器人有所交互；而另外一些人认为 Copilot 可以和其它聊天机器人交互，为用户提供更丰富、全面的信息。

3/23/2024 7:48:54 AM

故渊

零一万物 API 上线，用户反馈多模态中文能力超过 GPT-4V

零一万物由创新工场董事长兼首席执行官李开复创办于 2023 年 6 月，六个月后，零一万物便成功发布了 Yi 系列模型，包含 6B 和 34B 两个版本，并开源，打破了当时国产开源模型一直难以超过 14B 的现状。 34B也是黄金尺寸的模型，既达到了大模型“涌现”能力的门槛，同时也能在消费级显卡上训练，对开发者相对友好。此后较长一段时间 Yi-34B 在 Hugging Face 英文开源社区平台跻身前列，一举打响了零一万物的模型名声。

3/19/2024 7:25:00 PM

张进

“创新落地，生态共赢”，澜舟科技提出大模型落地应用“九字诀”

历经持续一年多的百模大战后，市场竞争逐渐深化，如何更快、更好地推进大模型的落地应用，开始成为各大大模型公司思考的焦点所在。 3月18日，澜舟科技在中关村国家自主创新示范区展示中心隆重举行了“创新落地，生态共赢”大模型技术和产品发布会。会上，澜舟科技展示了澜舟科技的大模型的最新进展和大模型技术的实际应用落地、生态构建的成果，更体现了其对未来发展的深度思考和战略布局。

3/19/2024 10:06:00 AM

晓楠

「创新落地，生态共赢」，2024澜舟科技大模型技术和产品发布会圆满举办

2024 年将是大模型落地元年。

3/18/2024 10:11:00 PM

机器之心

OpenAI 首席技术官：不确定 Sora 的训练数据来自哪里

感谢OpenAI 近期推出了炙手可热的文本转视频生成模型 Sora，然而该公司首席技术官 (CTO) Mira Murati 在接受华尔街日报采访时却语焉不详，无法明确说明 Sora 的训练数据来源。在采访中，记者直接询问 Murati 关于 Sora 训练数据来源时，她仅以含糊的官方话术搪塞：“我们使用的是公开可用数据和许可数据。”当记者追问具体来源是否包含 YouTube 视频时，Murati 竟然表示“我实际上并不确定（I'm actually not sure about that）”，并拒绝回答有关 In

3/18/2024 4:07:57 PM

远洋

全球首个类 Sora 开源复现方案来了！全面公开所有训练细节和模型权重

全球首个开源的类 Sora 架构视频生成模型，来了！整个训练流程，包括数据处理、所有训练细节和模型权重，全部开放。这就是刚刚发布的 Open-Sora 1.0。它带来的实际效果如下，能生成繁华都市夜景中的车水马龙。还能用航拍视角，展现悬崖海岸边，海水拍打着岩石的画面。亦或是延时摄影下的浩瀚星空。自 Sora 发布以来，由于效果惊艳但技术细节寥寥，揭秘、复现 Sora 成为了开发社区最热议话题之一。比如 Colossal-AI 团队推出成本直降 46% 的 Sora 训练推理复现流程。短短两周时间后，该团队再次发布最

3/18/2024 2:58:56 PM

清源

对话南佛罗里达大学孙宇教授：当大语言模型用于机器人任务规划丨IJAIRR

现代化社会，哪些工作场景最需要机器人的帮助？在工业领域，有著名的机器人“四大家族”——发那科、ABB、安川、库卡，经过百余年的发展技术越发成熟，在工业场景已经得到深入而广泛的应用。相比之下，生活场景中的服务型机器人历史则短得多。

3/15/2024 4:03:00 PM

乔燕薇

智谱AI狂飙：与商业化博弈的一年

2023 年 12 月 AI 科技评论在搜狐网络大厦见到智谱AI COO 张帆时，张帆如是说。张帆在 2023 年 3 月加入中国大模型领域“当红炸子鸡”智谱负责商业化，他感慨：“大模型不仅把知识给压缩了，还把时间给压缩了。 ”最直接的体现是，在过去的 9 个月，张帆以每个月见大约 100 家客户的速度在推进智谱的大模型商业化，2023 年结束时，张帆团队已拜访了上千家客户。

3/15/2024 3:36:00 PM

张进

AI4Science与LLM的碰撞：生物分子+文本的联合建模，人大高瓴、微软、华科、中科大团队最新综述

作者 | 裴启智随着大模型和 AI4Science 的蓬勃发展，越来越多的工作开始关注生物分子（Biomolecule）与自然语言（Language）的联合建模。这种方法利用文本数据中所包含的生物分子的丰富、多方面的描述，增强模型对其的理解，提高生物分子属性预测等下游任务的效果，为全面表示和分析生物分子开辟了新的途径。近日，人大高瓴联合微软、华科、中科大等机构发布了综述文章：《Leveraging Biomolecule and Natural Language through Multi-Modal Learni

3/14/2024 4:30:00 PM

ScienceAI

因使用受版权保护书籍训练 AI 平台，英伟达被三名作者起诉

感谢据美国福克斯电视台北京时间今日报道，科技巨头英伟达已被三名作者起诉，因为英伟达在训练其 AI 平台 NeMo 时，未经许可使用了他们受到版权保护的书籍。三名作者 Brian Keene、Abdi Nazemian 和 Stewart O'Nan 声称，自己的作品被收录在一个包含约 196640 本书籍的数据集内，这些书籍帮助训练 NeMo 模拟普通书面语言，但这个数据集因“被举报侵犯版权”在去年 10 月被撤下。（IT之家注：该数据集原本被托管在 Hugging Face 网站上）作者们在 3 月 8 日晚提交

3/11/2024 4:46:10 PM

清源

Gemini 修 bug 神了！录网页视频把代码库甩给它就行，网友想要访问权限

谷歌 Gemini 修改 bug 让网友大开眼界！X 一小伙分享，为测试 Gemini 1.5 Pro，自己在编写一个网页的代码时故意留了 3 个 bug，并分别录制了网页 bug 视频。接着把代码库打包成文件连同视频一起输给了 Gemini 1.5 Pro，提示它找到并修复代码中的所有 bug，且要提供一个简要指南以及所做更改的说明。没想到，Gemini 1.5 Pro 还真就分分钟正确识别并修复了每一个 bug。小伙将这种玩法 po 出来后热度不断攀升，网友们纷纷一键三连，转赞收藏量过万。其本人还在评论区强调，

3/10/2024 2:30:22 PM

清源

谷歌确认 Gemini Nano 本地大模型不会上线 Pixel 8 手机

谷歌官方表示，由于硬件限制，AI 语言大模型 Gemini Nano 不会上线谷歌 Pixel 8 手机，但未来会出现在其他高端设备上。IT之家获悉，Gemini 的前身是谷歌在 2023 年 2 月发布的聊天机器人 Bard，后者在 2024 年 2 月 8 日更名为 Gemini。谷歌计划将 Gemini 整合进旗下所有产品，并加入 Google One 订阅中。Gemini Nano 作为谷歌为移动设备推出的 Gemini 大模型版本，能够处理不需要连接外部服务器的本地任务，仅支持谷歌 Pixel 8 Pro

3/8/2024 5:56:25 PM

归泷（实习）

资讯热榜

苹果发布全新Xcode 26开发者工具：内置ChatGPT先进AI功能 DeepSeek前高管秘密创业，新AI Agent项目已获顶级VC押注那个男人回来了！Ilya现身多伦多大学毕业典礼：AI 像是用数字方式复制出来的大脑！不管你愿不愿意，AI都将深刻影响你的一生！支持MCP！开源智能体开发框架 Rowboat：打造你的智能助手只需几分钟 ChatGPT 语音功能升级，实时翻译对话更自然流畅肝了30小时，Flux Kontext是我用过最稳、最能干活的AI图像模型！谷歌 Gemini 应用月下载量超越 ChatGPT，用户活跃度仍显不足长文本理解新王者?Gemini2.5Pro 击败 o3领跑 Fiction.Live 基准测试

标签云

人工智能 AI OpenAI AIGC 模型 ChatGPT DeepSeek AI绘画数据谷歌机器人大模型 Midjourney 用户智能开源微软 GPT 学习 Meta 图像技术 AI创作 Gemini 论文马斯克 Stable Diffusion 算法代码英伟达 Anthropic 芯片生成式开发者蛋白质腾讯神经网络研究 3D 生成训练苹果计算智能体 Sora 机器学习 AI设计 AI for Science Claude GPU AI视频人形机器人华为搜索场景百度大语言模型 xAI 预测伟达深度学习 Transformer 字节跳动 Agent 模态具身智能神器推荐 LLaMA 文本视觉 Copilot 算力工具 LLM 驾驶 API 大型语言模型应用 RAG 亚马逊