大模型

谷歌I/O开发者大会中国站：大模型技术进入全生态

本周三，谷歌在北京召开了中国开发者大会。除 5 月加州山景城的 I/O 大会之外，今年的 I/O Connect 环球之旅从德国柏林开始、到印度班加罗尔，也已来到中国北京。在这次活动中，来自多个不同领域的专家为国内开发者深入分享了谷歌在 AI、Web、移动端、云技术等领域的最新技术进展、开发工具和全球服务平台等内容。「中国是全球最大的开发者市场之一，我们的开发者一直是全球舞台上不可或缺的先锋力量，」谷歌大中华区总裁陈俊廷在开幕演讲中表示。「过去一年，来自中国的 25 个开发团队共有 31 款游戏和应用，在全球不同的

8/9/2024 5:37:00 PM

李泽南

小米旗舰设备国际版将接入谷歌 Gemini 大模型，OPPO 此前已接入

感谢小米创办人雷军 8 月 7 日宣布，小米旗舰设备国际版将接入谷歌 AI 大模型 Google Gemini。小米目前已在国行机型中推出了自家的 AI 功能，7 月 30 日，小米小爱同学「大模型小爱」宣布全量升级，支持自然问答、图片编辑、车外唤醒防御等，覆盖核心品类设备。8 月 5 日，小米 14、Redmi K70 等机型推澎湃 OS 全 AI 功能，包括小爱输入助手、AI 写真、AI 搜图、实时字幕、端侧小爱同学文生图、端侧相册 AI 编辑等。AI在线查询获悉，2024 Google 开发者大会于 8 月

8/9/2024 1:16:23 PM

汪淼

手机跑大模型提速 4-5 倍：微软亚研院开源新技术 T-MAC，有 CPU 就行

有 CPU 就能跑大模型，性能甚至超过 NPU / GPU！没错，为了优化模型端侧部署，微软亚洲研究院提出了一种新技术 —— T-MAC。这项技术主打性价比，不仅能让端侧模型跑得更快，而且资源消耗量更少。咋做到的？？在 CPU 上高效部署低比特大语言模型一般来说，要想在手机、PC、树莓派等端侧设备上使用大语言模型，我们需要解决存储和计算问题。常见的方法是模型量化，即将模型的参数量化到较低的比特数，比如 4 比特、3 比特甚至更低，这样模型所需的存储空间和计算资源就会减少。不过这也意味着，在执行推理时，需要进行混合精

8/9/2024 12:58:46 PM

汪淼

消息称马斯克 X 平台同意不使用部分欧盟用户数据来训练 AI

感谢路透社今天（8 月 9 日）报道，马斯克旗下的 X 平台同意不使用部分欧盟用户数据，来训练其 AI 聊天机器人。爱尔兰一家法院周四表示，社交媒体平台 X 同意在欧盟用户选择撤销同意之前，暂时不使用从他们那里收集的个人数据来训练其 AI 系统。爱尔兰数据保护委员会本周寻求一项命令，要求暂停或限制 X 公司，不得处理用户数据来开发、训练或改进其人工智能系统。AI在线曾于 7 月报道，X 用户发现他们已“自动选择”将其帖子以及与 xAI 旗下 Grok 聊天机器人的互动用于“训练和微调”xAI 系统，此举是在未事先获

8/9/2024 10:42:44 AM

故渊

AI 搜索向左，搜索 OG 向右

作为 AI 世界的领头羊，OpenAI 发布的 SearchGPT 再次给 AI 搜索加了一把火。这把火原本由 Perplexity 引燃，在美国烧及 Google 和微软，在中国引发了百度、360 的追随，又带动一批创业者跟上，已然成为当下最时髦的热词。如果大模型之争能够被称为百模大战的话，那么 AI 搜索之争，就可以步其后尘，称之为“百搜大战”了。

8/8/2024 6:56:00 PM

晓楠

马斯克 X 平台因抓取用户数据训练 AI 在爱尔兰被起诉

感谢爱尔兰数据保护委员会（DPC）向高等法院提起诉讼，指控马斯克旗下的 X 平台擅用用户数据，用于训练 Grok AI 模型等增强型搜索工具。DPC 已委托 Remy Farrell SC 律师事务所提交诉讼，指控 Twitter International Unlimited Company 公司没有遵守 GDPR 规定的义务，使用用户数据训练 Grok。DPC 表示 X 平台虽然已提供了退出等缓解措施，但该公司仍收集大量欧盟用户数据，在诉讼中，DPC 寻求法院下令禁止或限制 X 使用用户个人数据来开发、训练或改

8/8/2024 10:43:59 AM

故渊

清华“太极-Ⅱ”光芯片面世：成果登 Nature，首创全前向智能光计算训练架构

据清华大学官方消息，清华大学电子工程系方璐教授课题组、自动化系戴琼海院士课题组另辟蹊径，首创了全前向智能光计算训练架构，研制了“太极-II”光训练芯片，实现了光计算系统大规模神经网络的高效精准训练。该研究成果以“光神经网络全前向训练”为题，于北京时间 8 月 7 日晚在线发表于《自然》期刊。AI在线查询获悉，清华大学电子系为论文第一单位，方璐教授、戴琼海教授为论文的通讯作者，清华大学电子系博士生薛智威、博士后周天贶为共同一作，电子系博士生徐智昊、之江实验室虞绍良博士参与了该项工作。该课题受到国家科技部、国家自然科学

8/8/2024 9:05:32 AM

汪淼

Meta 推出“自学评估器”：无需人工注释改善评估，性能超 GPT-4 等常用 AI 大语言模型评审

Meta 公司为了缓解自然语言处理（NLP）技术依赖人类注释评估 AI 模型的问题，最新推出了“自学评估器”（Self-Taught Evaluator），利用合成数据训练 AI。NPU 技术挑战NPU 技术的发展，推动大型语言模型（LLMs）高精度地执行复杂的语言相关任务，实现更自然的人机交互。不过当前 NPU 技术面临的一个重要挑战，就是评估模型严重依赖人工注释。人工生成的数据对于训练和验证模型至关重要，但收集这些数据既费钱又费时。而且随着模型的改进，以前收集的注释可能需要更新，从而降低了它们在评估新模型时的效

8/7/2024 3:56:11 PM

故渊

Meta 构建分布式 RoCEv2 网络：探索串联数万片 GPU，训练千亿参数级 AI 模型

Meta 公司于 8 月 5 日发布博文，表示为了满足大规模分布式 AI 训练对网络的需求，构建了基于 RoCEv2 协议的大规模 AI 网络。RoCEv2 的全称是 RDMA Over Converged Ethernet version 2，是一种节点间通信传输方式，用于大部分人工智能容量。Meta 公司已成功扩展了 RoCE 网络，从原型发展到部署了众多集群，每个集群可容纳数千个 GPU。这些 RoCE 集群支持广泛的生产型分布式 GPU 训练工作，包括排名、内容推荐、内容理解、自然语言处理和 GenAI 模

8/7/2024 7:35:32 AM

故渊

英伟达被曝未经许可抓取 YouTube、Netflix 平台视频用于训练 AI

科技媒体 404Media 披露的文件显示，英伟达收集了大量受版权包含的内容，用于训练人工智能（AI）。该媒体披露的内部邮件、电子邮件、Slack 对话以及相关文件显示，英伟达从 YouTube 等多个来源收集视频素材，用于扩充训练 AI 的数据集。该媒体披露的对话显示参与该项目的员工曾提出质疑，认为擅自使用 YouTube 视频以及研究目的编译的数据集，在法律层面可能会存在问题。不过项目经理的回复是，这种收集模式已经获得了公司最高层的许可，可以使用这些内容训练 AI，并认为“完全符合版权法的文字描述和精神”。一位

8/6/2024 1:53:57 PM

故渊

小扎自曝砸重金训 Meta Llama 4 模型：24 万块 GPU 齐发力，预计 2025 年发布

Llama 3.1 刚发布不久，Llama 4 已完全投入训练中。这几天，小扎在二季度财报会上称，Meta 将用 Llama 3 的十倍计算量，训练下一代多模态 Llama 4，预计在 2025 年发布。这笔账单，老黄又成为最大赢家十倍计算量，是什么概念？要知道，Llama 3 是在两个拥有 24,000 块 GPU 集群完成训练。也就是说，Llama 4 训练要用 24 万块 GPU。那么，Meta 存货还够不够？还记得小扎曾在年初宣布，计划到年底要部署 35 万块英伟达 H100。他还透露了更多的细节，Meta

8/5/2024 1:30:22 PM

汪淼

AI 大语言模型价格战将启？谷歌本月下调 Gemini 1.5 Flash 费用：降幅最高 78.6%

大语言模型的价格战要来了吗？谷歌公司昨日（8 月 2 日）更新价格页面，宣布将于 2024 年 8 月 12 日开始，Gemini 1.5 Flash 模型每百万输入 tokens 成本为 0.075 美元、每百万输出 tokens 成本为 0.3 美元（AI在线备注：当前约 2.2 元人民币）。这让 Gemini 1.5 Flash 模型的使用成本，比 OpenAI 的 GPT-4o mini 便宜近 50%。根据计算，Gemini 1.5 Flash 模型费用输入费用比此前降低 78.6%，输出费用比此前降低

8/3/2024 2:44:56 PM

故渊

谷歌勇攀 AI 新高峰，邀测最强 Gemini 1.5 Pro 模型：Arena 竞技场跑分超 GPT-4o

谷歌 AI Studio 产品总监 Logan Kilpatrick 昨日（8 月 2 日）在 X 平台发布推文，推出了实验版 Gemini 1.5 Pro AI 模型（0801），并邀请用户通过 AI Studio 和 Gemini API 测试和反馈。AI在线援引 Kilpatrick 后续推文，他表示在 LMSYS 的聊天机器人竞技场（Chatbot Arena）比赛中，无论是文本还是多模态，实验版 Gemini 1.5 Pro AI 模型（0801）均取得了第一名。实验版 Gemini 1.5 Pro AI

8/3/2024 11:50:14 AM

故渊

贾扬清一吐为快：要想赚钱，AI模型到底该大该小？

最近的AI社区，关于模型规模的讨论有些活跃。一方面，此前在大模型开发奉为“圣经”的Scaling Law，似乎正在褪去光环。去年大家还在猜测GPT-5的规模“可能会大到想不到”，现在这种讨论几乎绝迹。

8/3/2024 10:46:00 AM

刘洁

新王登基，Gemini 1.5 Pro再度更新，超越GPT 4o和Claude-3.5

8月2日，lmsys官方在推特发布一则消息，恭喜DeepMind研发的Gemini 1.5 Pro 实验版（0801）在Chatbot Arena排名登顶，超越GPT 4o和Claude-3.5夺得第一。这是继今年3月Claude 3 “超大杯”Opus版本短暂超越GPT-4以来，OpenAI第二次让出Chatbot Arena的Overall ranking宝座。 Gemini 1.5 Pro 实验版（0801）在Chatbot Arena测试一周后。

8/3/2024 10:35:00 AM

刘洁

现已下架，谷歌 Gemini 奥运广告遭吐槽：剥夺儿童学习机会，助涨过度依赖 AI 不良风气

谷歌在奥运期间为宣传自家 Gemini AI 服务，推出了名为《Dear Sydney》的宣传视频，不过发布后遭到广泛差评，目前已经下架。视频剧情视频的主角是一位年轻的女运动员，她的偶像是美国田径明星 Sydney McLaughlin-Levrone，旁白部分是她的父亲。她想要给 Sydney 写信，然后她的父亲借助 Gemini 来撰写了一封信件，该父亲在旁白中表示“她想向 Sydney 表达崇敬之情，情绪要饱满，但必须恰到好处”。于是该父亲向 Gemini 发出提示词：“帮我女儿写一封信，告诉 Sydney

8/3/2024 10:07:56 AM

故渊

Poe 的新功能好强！编程0基础，也能10分钟整出一个梗图编辑器

机器之能报道编辑：Sia国内大模型是不是要迅速跟上？最近，「北美知乎」问答社区 Quora 旗下的 AI 聊天平台 Poe，推出了一项名为「 Previews 」的新功能。有了这个实时预览功能，用户就能直接查看和使用在 Poe 聊天中生成的 Web 应用程序。也就是说，在 Poe ，你可以和一些非常擅长编码的 LLM 聊天，如 Claude-3.5-Sonnet 、GPT-4、Gemini 1.5 Pro 。聊天过程中生成的代码片段、网页设计、游戏等内容，都能在这个窗口预览到，还能上手体验。上手体验第一把

8/1/2024 4:02:00 PM

机器之能

视频生成赛道再添“猛将”，智谱清影正式上线

年初 Sora 横空出世，验证了 Scalling Law 在视频生成方面的有效性。但 Sora 始终止步于公开的 60 秒 demo，产品落地计划迟迟未有公开。随后的半年时间，不少“玩家”继续在AI视频生成赛道展开角逐，并逐步实现落地。

7/31/2024 2:36:00 PM

朱可轩

资讯热榜

苹果发布全新Xcode 26开发者工具：内置ChatGPT先进AI功能那个男人回来了！Ilya现身多伦多大学毕业典礼：AI 像是用数字方式复制出来的大脑！不管你愿不愿意，AI都将深刻影响你的一生！ DeepSeek前高管秘密创业，新AI Agent项目已获顶级VC押注 ChatGPT 语音功能升级，实时翻译对话更自然流畅支持MCP！开源智能体开发框架 Rowboat：打造你的智能助手只需几分钟谷歌 Gemini 应用月下载量超越 ChatGPT，用户活跃度仍显不足长文本理解新王者?Gemini2.5Pro 击败 o3领跑 Fiction.Live 基准测试苹果 WWDC 2025:iOS 26升级视觉智能，AI 助力屏幕内容识别

标签云

人工智能 AI OpenAI AIGC 模型 ChatGPT DeepSeek AI绘画数据谷歌机器人大模型 Midjourney 用户智能开源微软 GPT 学习 Meta 图像技术 AI创作 Gemini 论文马斯克 Stable Diffusion 算法代码英伟达 Anthropic 芯片生成式开发者蛋白质腾讯神经网络研究 3D 生成训练苹果计算智能体 Sora 机器学习 AI设计 AI for Science Claude GPU AI视频人形机器人华为搜索场景百度大语言模型 xAI 预测伟达深度学习 Transformer 字节跳动 Agent 模态具身智能神器推荐 LLaMA 文本视觉 Copilot 算力工具 LLM 驾驶 API 大型语言模型应用 RAG 亚马逊

大模型