AIGC宇宙 AIGC宇宙

GPT

面壁智能推出 MiniCPM-Llama3-V 2.5 开源端侧多模态模型:8B 参数、高效部署手机

感谢面壁智能昨晚推出并开源 MiniCPM 系列最新的端侧多模态模型 MiniCPM-Llama3-V 2.5,支持 30 种语言,宣称可实现:最强端侧多模态综合性能:超越 Gemini Pro 、GPT-4VOCR 能力 SOTA(IT之家注:State-of-the-Art):9 倍像素更清晰,难图长图长文本精准识别图像编码快 150 倍:首次端侧系统级多模态加速▲ OpenCompass 模型量级对比MiniCPM-Llama3-V 2.5 总参数量为 8B,多模态综合性能超越 GPT-4V-1106、Ge
5/21/2024 4:07:14 PM
泓澄(实习)

通义千问宣布“GPT-4 级”主力模型 Qwen-Long 降价 97%,一元 200 万 tokens

字节跳动 5 月 15 日正式发布了豆包大模型,宣布大模型价格进入“厘时代”,号称“比行业便宜 99.3%”。今日,阿里云紧随其后抛出重磅炸弹:通义千问 GPT-4 级主力模型 Qwen-Long 宣布降价,API 输入价格从 0.02 元 / 千 tokens 降至 0.0005 元 / 千 tokens,降幅 97%。简单来说,1 块钱可以买 200 万 tokens,相当于 5 本《新华字典》的文字量。这款模型最高支持 1 千万 tokens 长文本输入,降价后约为 GPT-4 价格的 1/400。参考IT之
5/21/2024 10:41:25 AM
问舟

Meta 首发「变色龙」挑战 GPT-4o,34B 参数引领多模态革命!10 万亿 token 训练刷新 SOTA

【新智元导读】GPT-4o 发布不到一周,首个敢于挑战王者的新模型诞生!最近,Meta 团队发布了「混合模态」Chameleon,可以在单一神经网络无缝处理文本和图像。10 万亿 token 训练的 34B 参数模型性能接近 GPT-4V,刷新 SOTA。GPT-4o 的横空出世,再次创立了一个多模态模型发展的新范式!为什么这么说?OpenAI 将其称为「首个『原生』多模态」模型,意味着 GPT-4o 与以往所有的模型,都不尽相同。传统的多模态基础模型,通常为每种模态采用特定的「编码器」或「解码器」,将不同的模态分
5/19/2024 6:54:10 PM
清源

ChatGPT 可以实时互动分析 Excel 数据了,网友挖出背后新模型

【新智元导读】GPT-4o 之后,ChatGPT 又迎来更新。这次,数据分析能力再上一个新台阶,将支持谷歌、微软在线文档上传,并实时交互,自定义图表。更重要的是,网友已经灰度测试到背后的新模型了。ChatGPT 更强了...刚刚,OpenAI 再次放出大招 ——ChatGPT 可以直接打开线上数据文件,完成实时数据分析。全新的增强功能,具体包括:- 直接从 Google Drive 和 Microsoft OneDrive 上传最新版本的文件- 在新的可扩展视图中与表格和图表进行交互- 自定义并下载图表,用于演示文
5/17/2024 11:38:20 PM
清源

OpenAI 阿尔特曼谈 GPT-5:功能或类似“虚拟大脑”,将是一种特别尝试

当地时间 16 日,OpenAI 首席执行官阿尔特曼接受了硅谷风险投资公司 Redpoint 的董事兼总经理 Logan Bartlett 的专访,谈到了前不久发布的 GPT-4o 和未来将发布的 GPT-5。阿尔特曼表示,人工智能的兴起将使人们渴望人与人之间的联系,其认为在未来 12 个月内编程领域“最有前途”。当被问及 GPT-5 的更多信息时,阿尔特曼表示,待该产品发布时可能会换一种叫法,它会“很特别”—— 功能与现在的(产品)有很大不同。“比如说从 GPT-1 到 GPT-4,从叫法和功能来看都比较偏传统。
5/17/2024 4:22:37 PM
清源

我们上手实测GPT-4o:速度快到飞起,还能直出板书,但视频分析逊色

机器之能原创作者:山茶花 Cardina作为 OpenAI 有史以来最好的模型, GPT-4o 究竟强在哪里?你要知道,它是一个原生的多模态大模型,可以跨文本、音频和视频进行实时推理——能听、能说、能看、零延时、可打断,还会「看人脸色」。更重要的是,它还免费!赶紧薅一把,你会知道什么是真・科幻照进现实!实测 GPT-4o:速度飞快,视觉能力惊艳打开 ChatGPT 官网,就会收到 GPT-4o 的试用邀请,点击「立即试用」即可进入对话页面。如果没有收到邀请,可能是灰度测试阶段,稍等一会再重新进入。然后,直接在下方的
5/16/2024 6:31:00 PM
机器之能

GPT-4o 再秀神操作,“复现”OpenAI 总裁讲课,网友当真了

OpenAI 总裁兼联合创始人 Greg 再次大秀 GPT-4o 操作,结果网友直接缅怀 DALL-E。直接看效果。文本拼写达到惊人的一致!手部细节、光照全都有,甚至后背上的 Logo 也完全正确。有网友表示:恍惚间还以为真的是本人在讲课。也有人感叹图像生成技术发展的飞跃:Holy Cow!从完全破碎的文本到风格一致、拼写正确的写作,只用了一次迭代。GPT-4o 让网友直接缅怀 DALL-EGPT-4o 发布以来,简直就被玩儿疯了,尤其是图像生成这块。比如有网友发现,GPT-4o 在组合任意图像上面就像是打通了任督
5/16/2024 2:56:58 PM
清源

人机交互大迈步,OpenAI GPT-4o 演示视频引热议:AI 之间也能聊天

OpenAI 昨日凌晨发布 GPT-4o 模型,可以视为 GPT-4 的升级版本,可以实时推理处理音频、视觉和文本内容,而且能更加无缝地和 ChatGPT 交互。OpenAI 总裁兼联合创始人格雷格・布罗克曼(Greg Brockman)随后发布了上手演示,让两台运行 GPT-4o 的设备进行语音或视频交互。布罗克曼在演示开始之前,表达了自己的期望:让两台 AI 聊天机器人互相交流。布罗克曼向其中 A 聊天机器人讲述了他的期望,并让 B 聊天机器人可以调用摄像头观察周围世界。B 聊天机器人会调用前置摄像头,并清晰地
5/15/2024 6:04:08 AM
故渊

OpenAI 曾秘密测试 GPT-4o,力压群雄登顶聊天机器人竞技场排行榜

OpenAI 员工 William Fedus 周一在社交平台 X 证实,近期在 LMSYS 聊天机器人竞技场 (Chatbot Arena) 上表现优异的神秘聊天机器人“gpt-chatbot”,正是他们刚刚发布的全新人工智能模型 GPT-4o。Fedus 还透露,GPT-4o 在测试中登顶了竞技场排行榜,取得了有史以来的最高分。“GPT-4o 是我们最先进的尖端模型,”Fedus 在推特上写道,“我们一直在竞技场使用‘im-also-a-good-gpt2-chatbot’的名称测试该模型的一个版本。”聊天机器
5/14/2024 6:24:44 PM
远洋

OpenAI 解释为何率先推出 Mac 版 ChatGPT 应用:用户更多

OpenAI 今日凌晨举办线上活动,发布了 ChatGPT 的一系列更新,其中包括升级版大型语言模型 GPT-4o,该模型具备增强的实时语音功能和更快的运行速度。图源:OpenAI众所周知,OpenAI 与微软关系密切,后者向其投资了超过 100 亿美元(IT之家备注:当前约 724 亿元人民币),并已经在自家的 Copilot 服务中使用 OpenAI 的技术。然而在本次活动上,OpenAI 率先发布了 macOS 版 ChatGPT 应用,Windows 版本今年晚些时候才会推出。对此,OpenAI 技术总监
5/14/2024 5:40:15 PM
远洋

GPT-4o 模型登陆微软 Azure OpenAI 服务,性能更强价格更低

OpenAI 于今日凌晨发布了其最新的旗舰人工智能模型 GPT-4o。相比先前版本,GPT-4o 实现了诸多升级:速度提升一倍,价格降低 50%(百万 token 的处理成本降至 7 美元),并且支持每分钟处理高达千万 token 的数据量。该模型拥有 128K 的上下文记忆能力,知识截止时间为 2023 年 10 月。微软宣布,已通过 Azure OpenAI 服务提供 GPT-4o 的预览版本。与以往的模型不同,GPT-4o 能够无缝处理文本、图像和音频信息,为用户带来更加丰富、沉浸的交互体验。不过IT之家注意
5/14/2024 4:49:00 PM
远洋

OpenAI 发布全新旗舰生成式 AI 模型 GPT-4o:语音对话更流畅,免费提供

感谢OpenAI 宣布推出其最新旗舰生成式 AI 模型 GPT-4o,该模型将在未来几周内分阶段集成至 OpenAI 的各个产品之中。最让人惊喜的是,GPT-4o 将免费提供给所有用户使用。综合 TechCrunch 等外媒报道,OpenAI 首席技术官穆里・穆拉蒂 (Muri Murati) 表示,GPT-4o 将提供与 GPT-4 同等水平的智能,但在文本、图像以及语音处理方面均取得了进一步提升。“GPT-4o 可以综合利用语音、文本和视觉信息进行推理,”穆拉蒂在 OpenAI 公司总部举行的主题演讲中表示。G
5/14/2024 1:25:13 AM
远洋

OpenAI 抓内鬼出奇招,阿尔特曼耍了所有人:GPT 搜索鸽了,改升级 GPT-4

感谢IT之家网友 咩咩洋、substring 的线索投递!最近 OpenAI 太反常,消息一会一变,直让人摸不着头脑。阿尔特曼宣布:5 月 13 日开发布会,不是 GPT-5,也不是盛传的 GPT 搜索引擎,改成对 ChatGPT 和 GPT-4 的升级~消息一出,大伙儿都蒙了。之前大张旗鼓给 SearchGPT 搜索引擎造势,域名、前端界面都准备好了,甚至已经有用户收到灰度测试。大有在谷歌 I / O 大会(5 月 14 日)前狙击一把谷歌核心业务的架子,就像春节期间用 Sora 狙击了谷歌大模型 Gemini
5/13/2024 1:30:24 PM
汪淼

消息称 OpenAI 将推出多模态人工智能数字助理:可语音对话、识别物体

据 The Information 报道,OpenAI 最近向部分客户展示了一款新型多模态人工智能模型,该模型能够进行语音对话和物体识别。有消息人士透露,这或许就是 OpenAI 计划在即将到来的 5 月 13 日正式发布的内容之一。图源 Pexels报道称,相比于 OpenAI 现有的独立图像识别和文本转语音模型,该新型模型能够更快、更准确地处理图像和音频信息。例如,它可以帮助客服人员“更好地理解来电者的语气语调,判断他们是否在使用讽刺语气”。理论上,该模型还能辅助学生学习数学知识,或翻译现实世界中的标志文字。不
5/12/2024 3:29:09 PM
远洋

未经许可重复使用原创文章训练模型,OpenAI 遭美国 8 家报纸出版商起诉

感谢据 CNBC 报道,当地时间 4 月 30 日,8 家美国报纸出版商在纽约的一家联邦法院对微软、OpenAI 提起诉讼,声称后者未经许可在生成式 AI 产品中重复使用这些出版商创作的文章,还将信息的不准确性归咎于出版商本身。图源 Pixabay根据 8 家出版商向美国纽约南区地方法院提交的诉状,ChatGPT 一直在“未经许可、未付款”的情况下,盗用了出版商数百万篇受版权保护的文章。IT之家查询发现,参与诉讼的出版商包括《纽约每日新闻》《芝加哥论坛报》《奥兰多哨兵报》《佛罗里达太阳哨兵报》《圣何塞水星报》《丹佛
5/1/2024 4:12:56 PM
清源

宜家宣布向人工智能化转型:开发专属 AI 工具、总部员工需“必修”相关知识

宜家母公司英格卡集团近日声称将进行“人工智能转型”,要求宜家总部内 3500 余员工需“必修”AI 知识,同时还将拓展一系列 AI 业务。IT之家从新闻稿中获悉,宜家声称自家总部企业内 3000 名基层员工及 500 名主管都要接受各种 AI 训练,要求员工掌握基础 AI 常识,同时了解生成式 AI 工具的使用方法,宜家主管还要定期开会,研究“如何掌握 AI 趋势、设计商业战略”。而针对有数据科学、机器学习或大型语言模型领域硕博士学位的员工,宜家还推出了专项培训计划,以便发挥这些员工的 AI 相关能力。此外,宜家目
4/27/2024 8:13:08 AM
漾仔

GPT-4 化身黑客搞破坏,成功率 87%!OpenAI 要求保密提示词,网友复现 ing

91 行代码、1056 个 token,GPT-4 化身黑客搞破坏!测试成功率达 87%,单次成本仅 8.8 美元 (折合人民币约 63 元)。这就是来自伊利诺伊大学香槟分校研究团队的最新研究。他们设计了一个黑客智能体框架,研究了包括 GPT-4、GPT-3.5 和众多开源模型在内的 10 个模型。结果发现只有 GPT-4 能够在阅读 CVE 漏洞描述后,学会利用漏洞攻击,而其它模型成功率为 0。研究人员表示,OpenAI 已要求他们不要向公众发布该研究的提示词。网友们立马赶来围观了,有人还搞起了复现。这是怎么一回
4/21/2024 12:53:34 PM
清源

5亿个token之后,我们得出关于GPT的七条宝贵经验

ChatGPT 正确的使用姿势。自 ChatGPT 问世以来,OpenAI 一直被认为是全球生成式大模型的领导者。2023 年 3 月,OpenAI 官方宣布,开发者可以通过 API 将 ChatGPT 和 Whisper 模型集成到他们的应用程序和产品中。在 GPT-4 发布的同时 OpenAI 也开放了其 API。一年过去了,OpenAI 的大模型使用体验究竟如何,行业内的开发者怎么评价?最近,初创公司 Truss 的 CTO Ken Kantzer 发布了一篇题为《Lessons after a half-b
4/19/2024 4:08:00 PM
机器之心