Gemini

古尔曼：苹果在 AI 领域至少落后谷歌两到三年

昨天谷歌提前召开新品发布会，抢在苹果 iPhone 16 系列发布前展示了 Pixel 9 系列搭载的全新 AI 功能，引发业内广泛关注。彭博社记者马克・古尔曼称，苹果在 AI 技术方面至少落后谷歌两三年。谷歌在本次发布会上全面展示了 Gemini AI 的强大功能，将其深度整合到了 Android 和 Pixel 手机中。相比之下，苹果虽然在 WWDC 上公布了 Apple Intelligence，但实际应用尚不成熟，消息称部分功能甚至无法在 iPhone 16 发布时及时推出。此外，谷歌还强调 Gemini

8/15/2024 11:05:38 AM

远洋

谷歌版 Her 大翻车：试了 3 次且换手机才成功… 网友：我手动只需 10 秒

翻车，大翻车。就在今天凌晨，谷歌版 Her——Gemini Live 正式发布。毕竟明显是对标 OpenAI 家的 GPT-4o，可以说是吸足了科技圈的眼球。在官网发布的 demo 中，拍照问答功能的效果是这样的：它大致实现的功能，是用手机拍摄演唱会的海报，并让 Gemini 查看用户的日历，看看行程是否适合参加。以及还可以基于此进行一系列后续的操作，包括定时间查票价等等。然而…… 当来到发布会现场演示环节的时候，画风却 180° 大变样。请看 VCR：第一次：失败了。第二次：失败了。第三次：换手机，成功了。嗯…

8/14/2024 12:26:03 PM

清源

谷歌发布 Gemini Live：支持 AI 语音聊天，可模拟面试场景、推荐演讲技巧

谷歌在今天召开的 Pixel 9 系列手机发布会上，发布了 Gemini Live 服务，将于今天开始率先面向使用英语的 Gemini Advanced 订阅用户开放。推动自然、流畅的对话交流谷歌表示 Gemini Live 提供了一种移动对话体验，让用户和 Gemini 展开自由流畅的对话。Gemini Live 可以说是对标 OpenAI ChatGPT 最新上线的 Advanced Voice 模式（限量 Alpha 测试），采用了增强型语音引擎，可以展开更连贯、更有情感表达力、更逼真的多轮对话。谷歌表示用

8/14/2024 3:02:04 AM

故渊

谷歌I/O开发者大会中国站：大模型技术进入全生态

本周三，谷歌在北京召开了中国开发者大会。除 5 月加州山景城的 I/O 大会之外，今年的 I/O Connect 环球之旅从德国柏林开始、到印度班加罗尔，也已来到中国北京。在这次活动中，来自多个不同领域的专家为国内开发者深入分享了谷歌在 AI、Web、移动端、云技术等领域的最新技术进展、开发工具和全球服务平台等内容。「中国是全球最大的开发者市场之一，我们的开发者一直是全球舞台上不可或缺的先锋力量，」谷歌大中华区总裁陈俊廷在开幕演讲中表示。「过去一年，来自中国的 25 个开发团队共有 31 款游戏和应用，在全球不同的

8/9/2024 5:37:00 PM

李泽南

小米旗舰设备国际版将接入谷歌 Gemini 大模型，OPPO 此前已接入

感谢小米创办人雷军 8 月 7 日宣布，小米旗舰设备国际版将接入谷歌 AI 大模型 Google Gemini。小米目前已在国行机型中推出了自家的 AI 功能，7 月 30 日，小米小爱同学「大模型小爱」宣布全量升级，支持自然问答、图片编辑、车外唤醒防御等，覆盖核心品类设备。8 月 5 日，小米 14、Redmi K70 等机型推澎湃 OS 全 AI 功能，包括小爱输入助手、AI 写真、AI 搜图、实时字幕、端侧小爱同学文生图、端侧相册 AI 编辑等。AI在线查询获悉，2024 Google 开发者大会于 8 月

8/9/2024 1:16:23 PM

汪淼

AI 大语言模型价格战将启？谷歌本月下调 Gemini 1.5 Flash 费用：降幅最高 78.6%

大语言模型的价格战要来了吗？谷歌公司昨日（8 月 2 日）更新价格页面，宣布将于 2024 年 8 月 12 日开始，Gemini 1.5 Flash 模型每百万输入 tokens 成本为 0.075 美元、每百万输出 tokens 成本为 0.3 美元（AI在线备注：当前约 2.2 元人民币）。这让 Gemini 1.5 Flash 模型的使用成本，比 OpenAI 的 GPT-4o mini 便宜近 50%。根据计算，Gemini 1.5 Flash 模型费用输入费用比此前降低 78.6%，输出费用比此前降低

8/3/2024 2:44:56 PM

故渊

谷歌勇攀 AI 新高峰，邀测最强 Gemini 1.5 Pro 模型：Arena 竞技场跑分超 GPT-4o

谷歌 AI Studio 产品总监 Logan Kilpatrick 昨日（8 月 2 日）在 X 平台发布推文，推出了实验版 Gemini 1.5 Pro AI 模型（0801），并邀请用户通过 AI Studio 和 Gemini API 测试和反馈。AI在线援引 Kilpatrick 后续推文，他表示在 LMSYS 的聊天机器人竞技场（Chatbot Arena）比赛中，无论是文本还是多模态，实验版 Gemini 1.5 Pro AI 模型（0801）均取得了第一名。实验版 Gemini 1.5 Pro AI

8/3/2024 11:50:14 AM

故渊

新王登基，Gemini 1.5 Pro再度更新，超越GPT 4o和Claude-3.5

8月2日，lmsys官方在推特发布一则消息，恭喜DeepMind研发的Gemini 1.5 Pro 实验版（0801）在Chatbot Arena排名登顶，超越GPT 4o和Claude-3.5夺得第一。这是继今年3月Claude 3 “超大杯”Opus版本短暂超越GPT-4以来，OpenAI第二次让出Chatbot Arena的Overall ranking宝座。 Gemini 1.5 Pro 实验版（0801）在Chatbot Arena测试一周后。

8/3/2024 10:35:00 AM

刘洁

现已下架，谷歌 Gemini 奥运广告遭吐槽：剥夺儿童学习机会，助涨过度依赖 AI 不良风气

谷歌在奥运期间为宣传自家 Gemini AI 服务，推出了名为《Dear Sydney》的宣传视频，不过发布后遭到广泛差评，目前已经下架。视频剧情视频的主角是一位年轻的女运动员，她的偶像是美国田径明星 Sydney McLaughlin-Levrone，旁白部分是她的父亲。她想要给 Sydney 写信，然后她的父亲借助 Gemini 来撰写了一封信件，该父亲在旁白中表示“她想向 Sydney 表达崇敬之情，情绪要饱满，但必须恰到好处”。于是该父亲向 Gemini 发出提示词：“帮我女儿写一封信，告诉 Sydney

8/3/2024 10:07:56 AM

故渊

大模型厂商密集发力，谷歌也开“卷”了：Gemini 聊天机器人换上新模型，还能一键核查输出内容

Meta、OpenAI 等大模型厂商密集发力之际，谷歌也宣布了一项重磅更新 ——即日起，Gemini 聊天机器人将改由 Gemini 1.5 Flash 驱动。与之前的版本相比，窗口长度提高到了 4 倍，响应速度也更快了。按照谷歌的介绍，新版聊天机器人背后的 1.5 Flash 模型，主打的就是轻量化和速度提升。当然模型回复的质量也有提升，上下文窗口也从原先（基于 1.0 Pro）的 8k 提升到了 32k。此外新版聊天机器人还增加了“事实核查”功能，可以一键检测生成的内容是否属实，减轻模型幻觉带来的不良影响。有网

7/26/2024 10:36:43 PM

清源

谷歌 Gemini 被曝今日起推出多项新功能：定制 GPT、记忆或个性化回复等

根据反向工程师 @testingcatalog 的发现，谷歌将在近期为其 Gemini 人工智能助手带来几项更新。从该工程师发布的截图来看，这一轮更新原计划在 7 月 11 日、7 月 18 日分批推送，但他又声称 7 月 11 日的更新已经推迟至 7 月 15 日（AI在线注：日期即今日，但以具体时区为准），预计当天将带来 1 项功能。而在 7 月 18 日，谷歌计划发布 4 项 Gemini 新功能。媒体 Testing Catalog 披露了近期即将发布的新功能，但未说明这些功能的具体上线日期。文生图工具 I

7/15/2024 6:02:35 PM

清源

谷歌 Gemini AI 遭质疑：未经用户同意读取 Google Drive 文档

感谢据 X 用户 @Kevin Bankston 的报告，谷歌的人工智能服务 Gemini AI 似乎在未经用户明确许可的情况下读取 Google Drive 中的私人文档。AI在线注意到，Bankston 在其推文中详细描述了这一问题。最初，他发现 Gemini 似乎在阅读他的 Google Drive 文档，但相关设置中找不到禁用该功能的选项。经进一步调查，他发现这是 Google Drive 本身的问题，而非 Google Docs，但两者可能都存在类似的漏洞。而且，根据 Gemini 人工智能的说法，用于控

7/15/2024 5:09:08 PM

远洋

如虎添翼，谷歌探索 AI + 机器人未来：836 平方米复杂场景下指令成功率高达 90%

感谢科技媒体 The Verge 昨日报道，谷歌旗下的 DeepMind 团队正在使用 Gemini 训练其机器人，让其能够完成更复杂的任务，且能在复杂的环境下自由穿梭。DeepMind 团队已经发表了最新的研究论文，利用 Gemini 1.5 Pro 的上下文窗口（达到 200 万个词元），让用户可以更轻松地使用自然语言指令与 RT-2 机器人互动。AI在线注：上下文窗口（context window）是指语言模型在进行预测或生成文本时，所考虑的前一个词元（token）或文本片段的大小范围。其工作原理是拍摄指定区

7/13/2024 9:09:12 AM

故渊

AI 摘要“幻觉”风波未平，谷歌 Gemini 聊天机器人又被曝“胡言乱语”

前段时间，谷歌搜索“AI 摘要”（AI Overviews）功能因其经常提供具有严重错误的搜索结果而备受诟病，导致官方亲自下场保证后续会进行修正。而如今，又有网友爆料称谷歌旗下的人工智能产品“抽了风”，这次问题出在 Gemini 聊天机器人。从北京时间昨夜至今日凌晨，有 Reddit 网友陆续发现，Gemini 生成的回复偶尔会充斥着杂乱无章的代码和外文字母 —— 这些结果对用户的查询毫无帮助。过去几天里，部分 Gemini 用户陆续发现自己遇到了这一奇怪问题：Gemini 会输出胡言乱语。这些回复可能是一连串的重

6/5/2024 7:10:10 AM

清源

Arena Elo 基准测试：谷歌 Gemini 1.5 Pro 性能媲美 OpenAI GPT-4o

谷歌在 I / O 2024 开发者大会上，宣布将 Gemini 1.5 Pro 上下文窗口增加至 200 万个 tokens，那么 Gemini 1.5 Pro 性能究竟有多强悍？根据 LMSYS Org 公布的总排行榜对比，通过 Arena Elo 系统的测量，Gemini-1.5-Pro-API-0514 和 Gemini-Advanced-0514 都接近 GPT-4o。上述两款模型在中文方面的表现也非常优秀，Gemini 1.5 Pro 在“hard prompts”类别中也非常接近。IT之家注：Aren

5/30/2024 10:32:50 AM

故渊

Chromebook Plus 笔记本迎来谷歌 Gemini 加持，AI 功能助力写作、图片处理等

谷歌今日宣布将把 Gemini 人工智能以及该公司其他设备上的 AI 功能引入 Chromebook Plus 笔记本电脑，其中包括华硕、惠普已经在售的机型，以及宏碁即将推出的新品。这些现有和未来的 Chromebook Plus 机型都将支持谷歌的“帮助我写作”等新功能，以及使用生成式 AI 创建自定义壁纸的功能。谷歌相册的魔法编辑器（Magic Editor）也将在 Chromebook Plus 上可用，该功能此前已登陆部分老款安卓设备。IT之家注意到，谷歌在应用 Dock 栏上添加了 Gemini 图标，以

5/28/2024 10:52:51 PM

远洋

荣耀即将推出首款搭载谷歌 Gemini AI 的智能手机，预计面向海外市场

感谢荣耀终端有限公司宣布，即将推出首款搭载谷歌 Gemini AI 及相关功能的智能手机。IT之家援引 CNBC 消息，荣耀一位发言人透露，即将推出的设备将集成谷歌 Gemini AI、文本到图像生成工具 Imagen 2 等生成式 AI 服务，并且由 Google Cloud 提供相关的服务支持。今年初，荣耀终端有限公司推出其新一代的 MagicOS 8.0 中已经嵌入了自研端侧 7B “魔法大模型”，搭配内置的 YOYO 助理，已经实现了场景感知、意图决策、用户理解能力，支持自然语言、语音、图片、手势、眼动等多

5/27/2024 5:25:14 PM

满河（实习）

Adobe 预告安卓版 Acrobat 新功能：本地调用 Gemini Nano 汇总 PDF 文档内容

开发者米沙尔・拉赫曼（Mishaal Rahman）昨日发布博文，表示 Adobe 公司将充分利用 Gemini Nano 模型，计划在安卓新版 Acrobat 中实现汇总文档内容等 AI 功能。谷歌推出了名为 AICore 的全新工具，可以让应用开发者调用 Gemini Nano 本地模型。谷歌基本解决所有的技术问题，因开发人员可以专注于为他们的应用程序构建新功能。IT之家从报道中获悉，在谷歌 I / O 主题演讲中，Adobe 表示已着手利用该工具改造 Acrobat 应用程序，实现快速总结 PDF 文件内容，

5/23/2024 8:34:01 AM

故渊

资讯热榜

DeepSeek-OCR：OCR 的新突破微软与OpenAI重塑联盟：2500亿美元Azure订单背后，OpenAI获“云自由”！ Soul App开源播客语音合成模型，可流畅自然多轮语音对话，支持川粤豫等多方言与副语言风格 Cursor发布首个编程大模型！代码生成250tokens/秒，强化学习+MoE架构 OpenAI推出两款全新的开源安全推理模型 OpenAI终于快要上市了，也直面了这23个灵魂拷问从反馈中学习：强化学习如何提升百晓生问答精准度奥特曼回应一切：重组后仍需微软支持，不相信OpenAI的欢迎做空

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek 谷歌 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能 AI新词用户 GPT 学习技术智能体马斯克 Gemini 图像 Anthropic 英伟达 AI创作训练 LLM 论文代码算法 Agent AI for Science 芯片苹果腾讯 Claude Stable Diffusion 蛋白质开发者生成式神经网络 xAI 机器学习 3D RAG 人形机器人研究 AI视频大语言模型生成具身智能 Sora 工具 GPU 百度华为计算字节跳动 AI设计 AGI 大型语言模型搜索视频生成场景深度学习架构生成式AI DeepMind 编程视觉 Transformer 预测 AI模型 MCP 伟达亚马逊