Gemini
谷歌 2 小时复仇硬刚 GPT-4o:Gemini 颠覆搜索,视频 AI 对抗 Sora
【新智元导读】被 OpenAI 提前截胡的谷歌,昨天不甘示弱地开启反击!大杀器 Project Astra 效果不输 GPT-4o,文生视频模型 Veo 硬刚 Sora,用 AI 彻底颠覆谷歌搜索,Gemini 1.5 Pro 达到 200 万 token 上下文…… 谷歌轰出一连串武器,对 OpenAI 贴脸开大。谷歌 I / O 2024 如期来了,眼花缭乱地发布了一堆更新。跟 OpenAI 半小时的「小而美」发布会相比,谷歌显然准备得更加充分,当然,时间也相当之长……▲ 2 个多小时的发布会也是挑战着观众们的
5/16/2024 1:24:48 PM
汪淼
谷歌 AI 视频搜索功能演示又翻车,Gemini 给出错误维修建议
在今天的谷歌 I / O 大会上,谷歌大肆宣传其名为 Gemini 的人工智能将接管搜索引擎领域。然而,在其炫酷的演示环节中,Gemini 却再次暴露了所有大型语言模型至今为止都存在的致命缺陷:自信满满地给出错误答案。在 “Gemini 时代下的搜索” 演示片段中,谷歌展示了其视频搜索功能,用户可以通过拍摄短视频并用语音提问进行搜索。演示的例子是一个卡住的胶片相机过片杆,用户询问“为什么扳杆无法移动到底”,Gemini 则识别出问题并提供了维修建议。 然而问题在于,Gemini 给出的答案整体而言令人啼笑皆非。谷歌
5/15/2024 4:28:24 PM
远洋
谷歌 Calendar、Tasks 和 Keep 等服务将集成 Gemini
谷歌公司在今天召开的 I / O 2024 开发者大会上,宣布在 Google Calendar、Tasks 和 Keep 应用中整合 Gemini 模型,为用户带来更丰富的 AI 功能。谷歌在开发者大会上表示,Gemini 聊天机器人支持网页或者移动 App 中上传图片操作,IT之家附上谷歌官方例子如下,拍一张学校活动列表的照片,然后让 Gemini 把它们添加到你的个人 Google Calendar 中。谷歌提供的另一个例子是让 Gemini 将食谱中的项目添加到谷歌 Keep 购物清单中。Gemini 负责
5/15/2024 4:06:11 AM
故渊
谷歌 Workspace 办公套件整合 Gemini:可总结邮件内容、梳理会议要点等
谷歌公司在今天召开的 I / O 2024 开发者大会上,宣布 Google Workspace 将进一步整合 Gemini,在侧面板中将推出基于 Gemini 1.5 Pro 的诸多技能。谷歌表示 Workspace 整合 Gemini 的作用,是为用户节省从多个应用程序中挖掘文件、电子邮件和其他数据的时间和精力。谷歌 Workspace 副总裁阿帕纳・帕普(Aparna Pappu)在会上说:“Gemini 时代的 Workspace 将开启完成工作的新方式”。IT之家注:谷歌 Workspace 的 Gmai
5/15/2024 3:45:19 AM
故渊
谷歌 Gemini 解锁旅行规划技能,几秒内帮你妥当安排行程
谷歌公司在今天召开的 I / O 2024 开发者大会上,宣布为 Gemini 引入旅行规划功能,结合个人信息和公共出行信息,帮用户规划预订航班、酒店等等。谷歌表示 Gemini 可以基于用户的提示,挖掘航班时间和酒店预订等具体细节,在几秒钟内制定出合适的度假行程。谷歌副总裁兼 Gemini 总经理 Sissie Hsiao 表示,用户手动规划一次旅行可能需要数小时、数天甚至数周的时间,而 Gemini 几乎可以瞬间完成。Hsiao 表示 Gemini 的规划是动态的,用户可以根据后期提示和其它要求进一步调整规划。
5/15/2024 3:28:56 AM
故渊
你的助手你决定,谷歌推出 Gems 功能:由用户定制 Gemini 角色
谷歌公司在今天召开的 I / O 2024 开发者大会上,宣布为 Gemini 推出名为“Gems”的个性化选项,可以让用户定制 Gemini 助手角色。Gems 功能可以让用户迭代的聊天机器人,在保留指定特征的情况下帮助你完成某些任务。Gems 感觉类似于 OpenAI 的 GPT Store,可以让你制作定制的 ChatGPT 聊天机器人。该功能也有点像在 Character.AI 中创建自己的机器人,Character.AI 可以让你与虚拟的流行人物和名人甚至假冒的心理医生交谈。谷歌表示,用户通过 Gems
5/15/2024 3:12:28 AM
故渊
谷歌 Gemini 家族添 Flash 新成员:平衡规模和能力、支持多模态,单次可分析 3 万行代码
谷歌公司今天扩充 Gemini 家族成员,推出了全新的 Gemini 1.5 Flash 模型,重点优化了该模型的速度和效率。谷歌 DeepMind 首席执行官德米斯・哈萨比斯(Demis Hassabis)在一篇博客文章中写道:Gemini 1.5 Flash 擅长摘要、聊天应用、图像和视频字幕、从长文档和表格中提取数据等。哈萨比斯补充说,谷歌之所以创建 Gemini 1.5 Flash,是因为开发人员需要一个比谷歌今年 2 月发布的 Gemini 1.5 Pro 更轻便、更便宜的模型。IT之家注:Gemini
5/15/2024 1:47:17 AM
故渊
AI 聊天机器人大战升温:谷歌 Gemini 预告片展示惊艳语音视频交互能力
人工智能聊天机器人领域烽烟再起,谷歌和 OpenAI 之间激烈的竞争态势愈演愈烈。就在谷歌一年一度的 I / O 开发者大会召开前夕,这家科技巨头发布了一段视频,展示了疑似经过升级的 Gemini 聊天机器人。视频中,Gemini 可以同时实时处理来自视频和语音的输入。这段视频貌似是在 I / O 大会搭建现场拍摄的,视频展示了 Gemini 在一台 Pixel 手机上流畅地处理实时视频和语音提问,并准确地提供信息。当被问到正在进行的布置工作时,Gemini 正确识别出这是为一个重要活动做的准备。 整个对话过程自然
5/14/2024 6:06:23 PM
远洋
iPhone AI 大升级:消息称苹果即将与 OpenAI 达成协议,iOS 18 用上 ChatGPT
感谢彭博社记者马克・古尔曼(Mark Gurman)今日发文表示,苹果即将与 OpenAI 达成协议,为今年的新 iOS 系统提供一些生成式 AI 功能(如聊天机器人)。此外,苹果与谷歌就整合 Gemini 的谈判正在进行中,但尚未达成任何协议。知情人士称,双方一直在敲定苹果下一代 iPhone 操作系统 iOS 18 中使用 ChatGPT 功能的协议条款。由于情况保密,该人士要求匿名。苹果还与谷歌就授权后者的 Gemini 聊天机器人进行了谈判。这些讨论尚未达成协议,但仍在进行中。OpenAI 宣布将于太平洋时
5/11/2024 12:29:20 PM
汪淼
91.1% 准确率,性能远超 GPT-4 系列模型,谷歌推出多模态医学大模型 Med-Gemini
编辑 | 萝卜皮各种复杂的医疗应用给人工智能带来了巨大挑战:需要先进的推理、获取最新的医学知识以及对复杂的多模态数据的理解。Gemini 模型在多模态和长上下文推理方面具有强大的通用能力,为 AI 在医学领域应用提供了可能性。基于 Gemini 的核心优势,谷歌的研究人员推出了 Med-Gemini,这是一个功能强大的多模态模型系列,专门用于医学,能够无缝使用网络搜索,并且可以使用自定义编码器有效地针对新颖的模态进行定制。研究人员用 14 项医疗基准评估 Med-Gemini,在其中 10 项上建立了新的最先进(S
5/7/2024 6:43:00 PM
ScienceAI
Chrome 浏览器桌面版地址栏整合自家聊天机器人:@Gemini 即可召唤
谷歌 Chrome 浏览器今日早些时候在 X(推特)宣布,其桌面版地址栏现已整合 Gemini 聊天机器人,用户可以通过简单、便捷的方式将 Gemini 召唤出来:在地址栏中输入“@”,然后选择“与 Gemini 聊天”,输入自定的提示词即可获取 Gemini 的回复。不久之前,该功能仍在 Canary 版本中进行测试。经IT之家此次实测,当 Chrome 更新至 124.0.6367.119(正式版本)之后,即可体验。Gemini 是谷歌 Deepmind 最新、最强大的 AI 模型。它原生支持多模态,具备跨模态
5/1/2024 10:39:05 PM
清源
移动版谷歌 Gemini 将迎诸多新特性:分析 PDF 文件内容等
感谢消息源 AssembleDebug 近日挖掘安卓版 Gemini 应用程序,发现隐藏了诸多新功能 / 新特性,包括上传 PDF 等文件,引入 Live Prompts、Select text 功能等。上传并分析 PDF 格式文件安卓版 Gemini 现阶段仅支持上传图片,而在最新版中相关代码已经出现了上传 PDF 等文件描述,可以分析文档中的内容,只是该功能目前尚未生效。Select text安卓版 Gemini 此前提供的回答只能全文复制,用户需要复制粘贴到其它地方再进行优化。而在最新选项中新增了“Selec
4/24/2024 2:20:15 PM
故渊
Chrome 浏览器桌面版地址栏即将整合聊天机器人 Gemini
感谢桌面 Chrome 浏览器地址栏即将添加 Gemini 快捷方式,用户在 Gemini 网页上登录账户后,用户只需输入 @gemini 即可快速与谷歌的人工智能聊天机器人 Gemini 开始聊天。该功能目前正在 Chrome 浏览器 Canary 测试版中进行测试,地址栏下拉菜单底部会出现提醒,“输入 @gemini 与 Gemini 聊天”。目前该功能仅适用于 Chrome 浏览器 Canary 125 版本,需要启用两个标志(Flags)才能开启,IT之家汇总如下:chrome://flags/#omnib
4/17/2024 2:04:23 PM
沛霖(实习)
融合 ChatGPT+DALL・E 3,贾佳亚团队新作开源畅玩:识图推理生图一站解决
在开源社区中把 GPT-4 Dall・E 3 能⼒整合起来的模型该有多强?香港中文大学终身教授贾佳亚团队提出多模态模型 Mini-Gemini:更高清图像的精确理解、更高质量的训练数据、更强的图像解析推理能力,还能结合图像推理和生成,堪称王炸。Mini-Gemini 还提供了 2B 小杯到 34B 的超大杯,最强模型在多个指标上相比谷歌的 Gemini Pro 甚至 GPT-4V 都不遑多让。目前,Mini-Gemini 从代码、模型到数据已全部开源,登上了 PaperWithCode 热榜。Mini-Gemini
4/15/2024 4:07:17 PM
清源
谷歌 Gemini 流量已是 ChatGPT 的四分之一
Github 前首席执行官 Nat Friedman 在 X(推特)上发帖,称谷歌 Gemini 流量已经到达 ChatGPT 的 25% 左右,这一成绩是在谷歌并没有通过庞大分销渠道(Android、Google 搜索、GSuite 等)大力推广的情况下完成的。此外他还提到,在 X 上比较火爆的 Claude 使用率仍然很低,微软的 Copilot 使用率也并不高,而最知名的 ChatGPT 流量则与去年相对持平,没有明显的增长。他认为 Claude、ChatGPT 和 Gemini 的付费与未付费比率差异很大。
4/12/2024 1:37:01 PM
沛霖(实习)
谷歌推出 Gemini 1.5 Pro 公共预览版,现已支持处理音频
谷歌之前在 Google Next 大会上宣布将首次通过其 AI 应用平台 Vertex AI 向公众开放 Gemini 1.5 Pro。谷歌现已推出 Gemini 1.5 Pro 公共预览版,并借此为其赋予了“耳朵”,从而帮助用户处理音频内容,例如可以直接上传一份音频文件让它来分析,或者上传一份财报电话会议录音或视频来让它总结。据称,这个 Gemini 系列中定位“中量级”模型的版本在性能上已经超越了自家更大的模型 ——Gemini Ultra。谷歌称,Gemini 1.5 Pro 可以理解复杂的指令,并且无需对
4/9/2024 8:35:21 PM
问舟
消息称谷歌考虑对基于 AI 的搜索引擎收费,将部分功能添至高级订阅服务
感谢据英国《金融时报》援引三位熟悉谷歌的知情人士消息称,谷歌考虑对基于人工智能的搜索收费,这对其商业模式来说是一次重大变化。因为自 2000 年以来,谷歌的搜索产品一直都是依靠广告盈利的。据报道,谷歌正在考虑保持标准搜索(不含 AI 功能)免费,谷歌正在考虑各种选择,包括将某些基于 AI 的搜索功能添加到其高级订阅服务中。但是,付费用户仍将在 Gemini 驱动的搜索结果中看到广告。尽管搜索广告去年为谷歌带来了 1750 亿美元的收入,但仍可能不足以弥补 AI 搜索增加的成本。根据路透社去年的报告,通过 Gemin
4/4/2024 8:45:32 AM
清源
消息称谷歌借助 AI 探索商业模式变革,将为苹果 iPhone 用户提供付费 Gemini AI 技能
感谢谷歌正在积极探索生成式 AI-- Gemini 的变现方式,而提供付费高级功能显然是不错的选择。IT之家援引 Financial Times 报道,谷歌将为苹果 iOS 18 用户提供各种付费 AI 功能。消息称苹果目前正和谷歌等多家 AI 公司合作,会在 iOS 18 系统中开辟 AI Store 应用商店,用户可以通过支付相关费用,解锁更多 AI 技能。谷歌也在探索广告之外的其它营收方式,通过在苹果 iPhone 中扩展 Gemini 服务,积极扩充生成式 AI 的诸多付费技能,只是现阶段谷歌的这种变现渠道
4/4/2024 8:12:01 AM
故渊
资讯热榜
ChatGPT或将引入广告!OpenAI高管首度松口,用户破7亿仍难盈利
扎克伯格看OpenAI直播挖人,北大校友孙之清加入Meta
Nvidia 投资 5 亿美元,Cohere 公司估值达 68 亿美元
马斯克手撕OpenAI,奥特曼反击:AI巨头互曝老底,苹果被拖下水
破天荒!OpenAI、Cursor多位开发大牛联手曝出GPT5提示词指南!晒官方系统提示词优化秘籍,最大化编程性能,工作流更可控
IDC:未来五年,中国生成式 AI 相关硬件支出将激增至 330 亿元
OpenAI华人露头就被小扎挖!95后北大校友1个月前上直播,今天已是Meta人
OpenAI 开源模型被 Meta 研究员“逆改”!只动0.3%参数,gpt-oss-20B 解锁无约束基座
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
马斯克
AI创作
智能体
论文
英伟达
Anthropic
代码
训练
算法
Stable Diffusion
芯片
蛋白质
LLM
开发者
腾讯
AI新词
生成式
Claude
苹果
Agent
神经网络
AI for Science
3D
机器学习
研究
生成
xAI
人形机器人
AI视频
计算
Sora
GPU
AI设计
百度
华为
工具
大语言模型
搜索
具身智能
场景
RAG
字节跳动
大型语言模型
深度学习
预测
伟达
视觉
Transformer
视频生成
AGI
架构
神器推荐
亚马逊
Copilot
DeepMind
应用
安全