应用
人机交互大迈步,OpenAI GPT-4o 演示视频引热议:AI 之间也能聊天
OpenAI 昨日凌晨发布 GPT-4o 模型,可以视为 GPT-4 的升级版本,可以实时推理处理音频、视觉和文本内容,而且能更加无缝地和 ChatGPT 交互。OpenAI 总裁兼联合创始人格雷格・布罗克曼(Greg Brockman)随后发布了上手演示,让两台运行 GPT-4o 的设备进行语音或视频交互。布罗克曼在演示开始之前,表达了自己的期望:让两台 AI 聊天机器人互相交流。布罗克曼向其中 A 聊天机器人讲述了他的期望,并让 B 聊天机器人可以调用摄像头观察周围世界。B 聊天机器人会调用前置摄像头,并清晰地
5/15/2024 6:04:08 AM
故渊
谷歌 Calendar、Tasks 和 Keep 等服务将集成 Gemini
谷歌公司在今天召开的 I / O 2024 开发者大会上,宣布在 Google Calendar、Tasks 和 Keep 应用中整合 Gemini 模型,为用户带来更丰富的 AI 功能。谷歌在开发者大会上表示,Gemini 聊天机器人支持网页或者移动 App 中上传图片操作,IT之家附上谷歌官方例子如下,拍一张学校活动列表的照片,然后让 Gemini 把它们添加到你的个人 Google Calendar 中。谷歌提供的另一个例子是让 Gemini 将食谱中的项目添加到谷歌 Keep 购物清单中。Gemini 负责
5/15/2024 4:06:11 AM
故渊
谷歌 Workspace 办公套件整合 Gemini:可总结邮件内容、梳理会议要点等
谷歌公司在今天召开的 I / O 2024 开发者大会上,宣布 Google Workspace 将进一步整合 Gemini,在侧面板中将推出基于 Gemini 1.5 Pro 的诸多技能。谷歌表示 Workspace 整合 Gemini 的作用,是为用户节省从多个应用程序中挖掘文件、电子邮件和其他数据的时间和精力。谷歌 Workspace 副总裁阿帕纳・帕普(Aparna Pappu)在会上说:“Gemini 时代的 Workspace 将开启完成工作的新方式”。IT之家注:谷歌 Workspace 的 Gmai
5/15/2024 3:45:19 AM
故渊
谷歌 Gemini 解锁旅行规划技能,几秒内帮你妥当安排行程
谷歌公司在今天召开的 I / O 2024 开发者大会上,宣布为 Gemini 引入旅行规划功能,结合个人信息和公共出行信息,帮用户规划预订航班、酒店等等。谷歌表示 Gemini 可以基于用户的提示,挖掘航班时间和酒店预订等具体细节,在几秒钟内制定出合适的度假行程。谷歌副总裁兼 Gemini 总经理 Sissie Hsiao 表示,用户手动规划一次旅行可能需要数小时、数天甚至数周的时间,而 Gemini 几乎可以瞬间完成。Hsiao 表示 Gemini 的规划是动态的,用户可以根据后期提示和其它要求进一步调整规划。
5/15/2024 3:28:56 AM
故渊
你的助手你决定,谷歌推出 Gems 功能:由用户定制 Gemini 角色
谷歌公司在今天召开的 I / O 2024 开发者大会上,宣布为 Gemini 推出名为“Gems”的个性化选项,可以让用户定制 Gemini 助手角色。Gems 功能可以让用户迭代的聊天机器人,在保留指定特征的情况下帮助你完成某些任务。Gems 感觉类似于 OpenAI 的 GPT Store,可以让你制作定制的 ChatGPT 聊天机器人。该功能也有点像在 Character.AI 中创建自己的机器人,Character.AI 可以让你与虚拟的流行人物和名人甚至假冒的心理医生交谈。谷歌表示,用户通过 Gems
5/15/2024 3:12:28 AM
故渊
谷歌 Gemini 家族添 Flash 新成员:平衡规模和能力、支持多模态,单次可分析 3 万行代码
谷歌公司今天扩充 Gemini 家族成员,推出了全新的 Gemini 1.5 Flash 模型,重点优化了该模型的速度和效率。谷歌 DeepMind 首席执行官德米斯・哈萨比斯(Demis Hassabis)在一篇博客文章中写道:Gemini 1.5 Flash 擅长摘要、聊天应用、图像和视频字幕、从长文档和表格中提取数据等。哈萨比斯补充说,谷歌之所以创建 Gemini 1.5 Flash,是因为开发人员需要一个比谷歌今年 2 月发布的 Gemini 1.5 Pro 更轻便、更便宜的模型。IT之家注:Gemini
5/15/2024 1:47:17 AM
故渊
AI 聊天机器人大战升温:谷歌 Gemini 预告片展示惊艳语音视频交互能力
人工智能聊天机器人领域烽烟再起,谷歌和 OpenAI 之间激烈的竞争态势愈演愈烈。就在谷歌一年一度的 I / O 开发者大会召开前夕,这家科技巨头发布了一段视频,展示了疑似经过升级的 Gemini 聊天机器人。视频中,Gemini 可以同时实时处理来自视频和语音的输入。这段视频貌似是在 I / O 大会搭建现场拍摄的,视频展示了 Gemini 在一台 Pixel 手机上流畅地处理实时视频和语音提问,并准确地提供信息。当被问到正在进行的布置工作时,Gemini 正确识别出这是为一个重要活动做的准备。 整个对话过程自然
5/14/2024 6:06:23 PM
远洋
OpenAI 解释为何率先推出 Mac 版 ChatGPT 应用:用户更多
OpenAI 今日凌晨举办线上活动,发布了 ChatGPT 的一系列更新,其中包括升级版大型语言模型 GPT-4o,该模型具备增强的实时语音功能和更快的运行速度。图源:OpenAI众所周知,OpenAI 与微软关系密切,后者向其投资了超过 100 亿美元(IT之家备注:当前约 724 亿元人民币),并已经在自家的 Copilot 服务中使用 OpenAI 的技术。然而在本次活动上,OpenAI 率先发布了 macOS 版 ChatGPT 应用,Windows 版本今年晚些时候才会推出。对此,OpenAI 技术总监
5/14/2024 5:40:15 PM
远洋
免费GPT-4o来袭,音频视觉文本实现「大一统」
作者 | 赖文昕今天凌晨,即北京时间5月14日1点整,OpenAI 召开了首场春季发布会,CTO Mira Murati 在台上和团队用短短不到30分钟的时间,揭开了最新旗舰模型 GPT-4o 的神秘面纱,以及基于 GPT-4o 的 ChatGPT,均为免费使用。 此前,有传言称 OpenAI 将推出 AI 搜索引擎,旨在与谷歌明天举办的 I/O 开发者大会一较高下,一度引发了公众的热烈讨论。 不过 Sam Altman 随后在 X(原推特)上表示,要展示的并非 GPT-5 或搜索引擎,而是一些令人期待的创新成果,他本人对此充满期待,认为其像魔法一样神奇。
5/14/2024 3:49:00 PM
赖文昕
OpenAI颠覆世界:GPT-4o完全免费,实时语音视频交互震撼全场,直接进入科幻时代
ChatGPT 问世才 17 个月,OpenAI 就拿出了科幻电影里的超级 AI,而且完全免费,人人可用。太震撼了!当各家科技公司还在追赶大模型多模态能力,把总结文本、P 图等功能放进手机里的时候,遥遥领先的 OpenAI 直接开了大招,发布的产品连自家 CEO 奥特曼都惊叹:就像电影里一样。5 月 14 日凌晨,OpenAI 在首次「春季新品发布会」上搬出了新一代旗舰生成模型 GPT-4o、桌面 App,并展示了一系列新能力。这一次,技术颠覆了产品形态,OpenAI 用行动给全世界的科技公司上了一课。今天的主持人
5/14/2024 7:32:00 AM
机器之心
OpenAI 推出 Mac 版 ChatGPT 应用,今年晚些时候推出 Windows 版
OpenAI 终于推出了 ChatGPT 桌面版应用程序,该公司在官方公告中表示:“从今天开始,我们将首先向 Plus 用户推出 macOS 应用,并在未来几周内向更广泛的用户开放。我们还计划在今年晚些时候推出 Windows 版本。”OpenAI 还称,ChatGPT 还将拥有经过优化的用户界面。OpenAI 的演示显示,用户可以将处于最小化窗口的 ChatGPT 桌面应用与其他程序并排打开。用户可以通过输入或语音的方式向 ChatGPT 提问屏幕上显示的内容,ChatGPT 则能根据其“所见” 进行回答。Op
5/14/2024 1:48:54 AM
远洋
实现纹理素材自由!8 组纹理材质类 Midjourney 关键词
大家好,这里是和你们一起探索 AI 的花生~
纹理材质是设计中非常重要的一类素材,可以提升画面质感、丰富视觉层次。之前为大家推荐过一些免费的纹理素材下载网站,如今有了 AI 绘画工具,我们可以按自己的需要用文字定制任何需要的纹理,非常灵活方便。今天就为大家总结 8 类常用的纹理材质类 Midjourney 提示词,包括纸张、金属、岩石、木头、流体等,一起来看看吧~
相关推荐:一、纸张
① seamless plain white watercolor paper texture, rough paper --til
5/14/2024 1:48:27 AM
夏花生
AI绘画保姆级教程!如何用 ComfyUI 快速生成黏土风?
这个五一小长假,一款 Remini 的人工智能修图软件火了,一夜之间,大家都变成了粘土人。你喜欢粘土风格吗?这篇文章带你了解了解~一、前言
最近你是不是也被各个平台爆火的丑萌丑萌的粘土人照片视频刷屏了?这个五一小长假,一款 Remini 的人工智能修图软件火了,一夜之间,大家都变成了粘土人。很多人的第一反应是:太丑了!添加滤镜后的照片不仅丑萌丑萌,甚至还有点“呆傻”。还有网友评价:每一张都丑得很意外。真的很丑萌吗?我们一起瞧瞧!虽然丑出天际、丑到无语,甚至五官乱飞,但很多人一上手根本停不下来。有网友说,一玩玩到了凌
5/14/2024 12:14:02 AM
设计师学Ai(有课)
OpenAI 抓内鬼出奇招,阿尔特曼耍了所有人:GPT 搜索鸽了,改升级 GPT-4
感谢IT之家网友 咩咩洋、substring 的线索投递!最近 OpenAI 太反常,消息一会一变,直让人摸不着头脑。阿尔特曼宣布:5 月 13 日开发布会,不是 GPT-5,也不是盛传的 GPT 搜索引擎,改成对 ChatGPT 和 GPT-4 的升级~消息一出,大伙儿都蒙了。之前大张旗鼓给 SearchGPT 搜索引擎造势,域名、前端界面都准备好了,甚至已经有用户收到灰度测试。大有在谷歌 I / O 大会(5 月 14 日)前狙击一把谷歌核心业务的架子,就像春节期间用 Sora 狙击了谷歌大模型 Gemini
5/13/2024 1:30:24 PM
汪淼
OpenAI GPT 搜索引擎原型曝光:新模型 GPT4-Lite 驱动,虽然鸽了发布会但代码已上传
OpenAI 发布会前一天,员工集体发疯中…… 上演大型套娃行为艺术。A:我为 B 的兴奋感到兴奋;B:我为 C 的兴奋感到兴奋……Z:我为这些升级感到兴奋与此同时还有小动作不断,比如现在 GPT-4 的文字描述已不再是“最先进的模型”,而仅仅是“先进的”。以及被鸽掉的 GPT 搜索引擎,原型代码上传到 ChatGPT 了。黑客“光头哥”Tibor Blaho,从更新的前端代码中扒出 SearchGPT 的界面。从泄露的界面来看,SearchGPT 会出现在侧边栏,与其他 GPTs 一起。首页目前还很简洁,像谷歌一
5/13/2024 12:44:57 PM
汪淼
在 ICLR 2024,看见中国大模型的力量
作者 | 赖文昕编辑 | 陈彩娴近日(5.7-5.11),第十二届国际学习表征会议(ICLR)在奥地利维也纳的展览会议中心召开。 ICLR 2024 的论文终审工作自 1 月份启动以来,共收到了7262篇提交论文,相较于上一年度的 4966 篇,增幅达到了 46.1%,接近翻了一番。 在严格的评审过程中,大会最终接受了 2260 篇论文,整体接收率维持在 31%,与去年的31.8%基本持平,其中 Spotlights 和 Oral 两种类型的论文展示分别有 367 篇(占5%)和 86 篇(占1.2%)论文获选。
5/13/2024 12:05:00 PM
赖文昕
OpenAI下周要有大动作,奥特曼在线剧透:不是GPT-5,不是搜索引擎
OpenAI 真是把大家的胃口吊足了,大家再忍忍就等到了。OpenAI 有了新动向!今日凌晨 OpenAI 官宣,将于美国时间 13 日上午 10 点进行一场直播。Sam Altman 随即转发这一消息,并表示「不是 gpt-5,不是搜索引擎,但我们一直在努力开发一些我们认为人们会喜欢的新东西!我感觉这就像魔法一样。」关于即将发布的内容,OpenAI 官方帖子提供的唯一细节是,此次发布将更新 ChatGPT 及其最新模型 GPT-4。OpenAI 员工程博文(Bowen Cheng)跟了个帖,「比 gpt-5 更酷
5/13/2024 10:46:00 AM
机器之心
设计师的文案加速器:5个超好用的AI写作助手工具测评
今天我要给大家介绍几款超级宝藏的 AI 写作助手工具,其中或许有大家所熟悉的产品。这些工具不仅精通语言艺术,更能在创作风格、语调和内容上提供专业的指导和支持。在接下来的章节中,我将介绍每个 AI 写作助手工具的简介、主要功能、使用场景以及使用示例。无论你是专注于视觉设计、用户体验设计,还是产品设计的专业人士,这些工具都将为你的工作流程带来显著的增益和创新灵感。让我们一起启程,探索这几款设计文案加速器吧~
一、讯飞星火
简介:讯飞星火认知大模型是科大讯飞发布的大模型。该模型具有 7 大核心能力,即文本生成、语言理解、
5/13/2024 1:00:42 AM
团队58UXD
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
数据
模型
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Gemini
Stable Diffusion
马斯克
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
3D
Sora
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
Claude
模态
字节跳动
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
亚马逊
科技
智能体
AGI
DeepMind