GPT
面壁智能推出 MiniCPM-Llama3-V 2.5 开源端侧多模态模型:8B 参数、高效部署手机
感谢面壁智能昨晚推出并开源 MiniCPM 系列最新的端侧多模态模型 MiniCPM-Llama3-V 2.5,支持 30 种语言,宣称可实现:最强端侧多模态综合性能:超越 Gemini Pro 、GPT-4VOCR 能力 SOTA(IT之家注:State-of-the-Art):9 倍像素更清晰,难图长图长文本精准识别图像编码快 150 倍:首次端侧系统级多模态加速▲ OpenCompass 模型量级对比MiniCPM-Llama3-V 2.5 总参数量为 8B,多模态综合性能超越 GPT-4V-1106、Ge
5/21/2024 4:07:14 PM
泓澄(实习)
通义千问宣布“GPT-4 级”主力模型 Qwen-Long 降价 97%,一元 200 万 tokens
字节跳动 5 月 15 日正式发布了豆包大模型,宣布大模型价格进入“厘时代”,号称“比行业便宜 99.3%”。今日,阿里云紧随其后抛出重磅炸弹:通义千问 GPT-4 级主力模型 Qwen-Long 宣布降价,API 输入价格从 0.02 元 / 千 tokens 降至 0.0005 元 / 千 tokens,降幅 97%。简单来说,1 块钱可以买 200 万 tokens,相当于 5 本《新华字典》的文字量。这款模型最高支持 1 千万 tokens 长文本输入,降价后约为 GPT-4 价格的 1/400。参考IT之
5/21/2024 10:41:25 AM
问舟
Meta 首发「变色龙」挑战 GPT-4o,34B 参数引领多模态革命!10 万亿 token 训练刷新 SOTA
【新智元导读】GPT-4o 发布不到一周,首个敢于挑战王者的新模型诞生!最近,Meta 团队发布了「混合模态」Chameleon,可以在单一神经网络无缝处理文本和图像。10 万亿 token 训练的 34B 参数模型性能接近 GPT-4V,刷新 SOTA。GPT-4o 的横空出世,再次创立了一个多模态模型发展的新范式!为什么这么说?OpenAI 将其称为「首个『原生』多模态」模型,意味着 GPT-4o 与以往所有的模型,都不尽相同。传统的多模态基础模型,通常为每种模态采用特定的「编码器」或「解码器」,将不同的模态分
5/19/2024 6:54:10 PM
清源
ChatGPT 可以实时互动分析 Excel 数据了,网友挖出背后新模型
【新智元导读】GPT-4o 之后,ChatGPT 又迎来更新。这次,数据分析能力再上一个新台阶,将支持谷歌、微软在线文档上传,并实时交互,自定义图表。更重要的是,网友已经灰度测试到背后的新模型了。ChatGPT 更强了...刚刚,OpenAI 再次放出大招 ——ChatGPT 可以直接打开线上数据文件,完成实时数据分析。全新的增强功能,具体包括:- 直接从 Google Drive 和 Microsoft OneDrive 上传最新版本的文件- 在新的可扩展视图中与表格和图表进行交互- 自定义并下载图表,用于演示文
5/17/2024 11:38:20 PM
清源
OpenAI 阿尔特曼谈 GPT-5:功能或类似“虚拟大脑”,将是一种特别尝试
当地时间 16 日,OpenAI 首席执行官阿尔特曼接受了硅谷风险投资公司 Redpoint 的董事兼总经理 Logan Bartlett 的专访,谈到了前不久发布的 GPT-4o 和未来将发布的 GPT-5。阿尔特曼表示,人工智能的兴起将使人们渴望人与人之间的联系,其认为在未来 12 个月内编程领域“最有前途”。当被问及 GPT-5 的更多信息时,阿尔特曼表示,待该产品发布时可能会换一种叫法,它会“很特别”—— 功能与现在的(产品)有很大不同。“比如说从 GPT-1 到 GPT-4,从叫法和功能来看都比较偏传统。
5/17/2024 4:22:37 PM
清源
我们上手实测GPT-4o:速度快到飞起,还能直出板书,但视频分析逊色
机器之能原创作者:山茶花 Cardina作为 OpenAI 有史以来最好的模型, GPT-4o 究竟强在哪里?你要知道,它是一个原生的多模态大模型,可以跨文本、音频和视频进行实时推理——能听、能说、能看、零延时、可打断,还会「看人脸色」。更重要的是,它还免费!赶紧薅一把,你会知道什么是真・科幻照进现实!实测 GPT-4o:速度飞快,视觉能力惊艳打开 ChatGPT 官网,就会收到 GPT-4o 的试用邀请,点击「立即试用」即可进入对话页面。如果没有收到邀请,可能是灰度测试阶段,稍等一会再重新进入。然后,直接在下方的
5/16/2024 6:31:00 PM
机器之能
GPT-4o 再秀神操作,“复现”OpenAI 总裁讲课,网友当真了
OpenAI 总裁兼联合创始人 Greg 再次大秀 GPT-4o 操作,结果网友直接缅怀 DALL-E。直接看效果。文本拼写达到惊人的一致!手部细节、光照全都有,甚至后背上的 Logo 也完全正确。有网友表示:恍惚间还以为真的是本人在讲课。也有人感叹图像生成技术发展的飞跃:Holy Cow!从完全破碎的文本到风格一致、拼写正确的写作,只用了一次迭代。GPT-4o 让网友直接缅怀 DALL-EGPT-4o 发布以来,简直就被玩儿疯了,尤其是图像生成这块。比如有网友发现,GPT-4o 在组合任意图像上面就像是打通了任督
5/16/2024 2:56:58 PM
清源
人机交互大迈步,OpenAI GPT-4o 演示视频引热议:AI 之间也能聊天
OpenAI 昨日凌晨发布 GPT-4o 模型,可以视为 GPT-4 的升级版本,可以实时推理处理音频、视觉和文本内容,而且能更加无缝地和 ChatGPT 交互。OpenAI 总裁兼联合创始人格雷格・布罗克曼(Greg Brockman)随后发布了上手演示,让两台运行 GPT-4o 的设备进行语音或视频交互。布罗克曼在演示开始之前,表达了自己的期望:让两台 AI 聊天机器人互相交流。布罗克曼向其中 A 聊天机器人讲述了他的期望,并让 B 聊天机器人可以调用摄像头观察周围世界。B 聊天机器人会调用前置摄像头,并清晰地
5/15/2024 6:04:08 AM
故渊
OpenAI 曾秘密测试 GPT-4o,力压群雄登顶聊天机器人竞技场排行榜
OpenAI 员工 William Fedus 周一在社交平台 X 证实,近期在 LMSYS 聊天机器人竞技场 (Chatbot Arena) 上表现优异的神秘聊天机器人“gpt-chatbot”,正是他们刚刚发布的全新人工智能模型 GPT-4o。Fedus 还透露,GPT-4o 在测试中登顶了竞技场排行榜,取得了有史以来的最高分。“GPT-4o 是我们最先进的尖端模型,”Fedus 在推特上写道,“我们一直在竞技场使用‘im-also-a-good-gpt2-chatbot’的名称测试该模型的一个版本。”聊天机器
5/14/2024 6:24:44 PM
远洋
OpenAI 解释为何率先推出 Mac 版 ChatGPT 应用:用户更多
OpenAI 今日凌晨举办线上活动,发布了 ChatGPT 的一系列更新,其中包括升级版大型语言模型 GPT-4o,该模型具备增强的实时语音功能和更快的运行速度。图源:OpenAI众所周知,OpenAI 与微软关系密切,后者向其投资了超过 100 亿美元(IT之家备注:当前约 724 亿元人民币),并已经在自家的 Copilot 服务中使用 OpenAI 的技术。然而在本次活动上,OpenAI 率先发布了 macOS 版 ChatGPT 应用,Windows 版本今年晚些时候才会推出。对此,OpenAI 技术总监
5/14/2024 5:40:15 PM
远洋
GPT-4o 模型登陆微软 Azure OpenAI 服务,性能更强价格更低
OpenAI 于今日凌晨发布了其最新的旗舰人工智能模型 GPT-4o。相比先前版本,GPT-4o 实现了诸多升级:速度提升一倍,价格降低 50%(百万 token 的处理成本降至 7 美元),并且支持每分钟处理高达千万 token 的数据量。该模型拥有 128K 的上下文记忆能力,知识截止时间为 2023 年 10 月。微软宣布,已通过 Azure OpenAI 服务提供 GPT-4o 的预览版本。与以往的模型不同,GPT-4o 能够无缝处理文本、图像和音频信息,为用户带来更加丰富、沉浸的交互体验。不过IT之家注意
5/14/2024 4:49:00 PM
远洋
OpenAI 发布全新旗舰生成式 AI 模型 GPT-4o:语音对话更流畅,免费提供
感谢OpenAI 宣布推出其最新旗舰生成式 AI 模型 GPT-4o,该模型将在未来几周内分阶段集成至 OpenAI 的各个产品之中。最让人惊喜的是,GPT-4o 将免费提供给所有用户使用。综合 TechCrunch 等外媒报道,OpenAI 首席技术官穆里・穆拉蒂 (Muri Murati) 表示,GPT-4o 将提供与 GPT-4 同等水平的智能,但在文本、图像以及语音处理方面均取得了进一步提升。“GPT-4o 可以综合利用语音、文本和视觉信息进行推理,”穆拉蒂在 OpenAI 公司总部举行的主题演讲中表示。G
5/14/2024 1:25:13 AM
远洋
OpenAI 抓内鬼出奇招,阿尔特曼耍了所有人:GPT 搜索鸽了,改升级 GPT-4
感谢IT之家网友 咩咩洋、substring 的线索投递!最近 OpenAI 太反常,消息一会一变,直让人摸不着头脑。阿尔特曼宣布:5 月 13 日开发布会,不是 GPT-5,也不是盛传的 GPT 搜索引擎,改成对 ChatGPT 和 GPT-4 的升级~消息一出,大伙儿都蒙了。之前大张旗鼓给 SearchGPT 搜索引擎造势,域名、前端界面都准备好了,甚至已经有用户收到灰度测试。大有在谷歌 I / O 大会(5 月 14 日)前狙击一把谷歌核心业务的架子,就像春节期间用 Sora 狙击了谷歌大模型 Gemini
5/13/2024 1:30:24 PM
汪淼
消息称 OpenAI 将推出多模态人工智能数字助理:可语音对话、识别物体
据 The Information 报道,OpenAI 最近向部分客户展示了一款新型多模态人工智能模型,该模型能够进行语音对话和物体识别。有消息人士透露,这或许就是 OpenAI 计划在即将到来的 5 月 13 日正式发布的内容之一。图源 Pexels报道称,相比于 OpenAI 现有的独立图像识别和文本转语音模型,该新型模型能够更快、更准确地处理图像和音频信息。例如,它可以帮助客服人员“更好地理解来电者的语气语调,判断他们是否在使用讽刺语气”。理论上,该模型还能辅助学生学习数学知识,或翻译现实世界中的标志文字。不
5/12/2024 3:29:09 PM
远洋
未经许可重复使用原创文章训练模型,OpenAI 遭美国 8 家报纸出版商起诉
感谢据 CNBC 报道,当地时间 4 月 30 日,8 家美国报纸出版商在纽约的一家联邦法院对微软、OpenAI 提起诉讼,声称后者未经许可在生成式 AI 产品中重复使用这些出版商创作的文章,还将信息的不准确性归咎于出版商本身。图源 Pixabay根据 8 家出版商向美国纽约南区地方法院提交的诉状,ChatGPT 一直在“未经许可、未付款”的情况下,盗用了出版商数百万篇受版权保护的文章。IT之家查询发现,参与诉讼的出版商包括《纽约每日新闻》《芝加哥论坛报》《奥兰多哨兵报》《佛罗里达太阳哨兵报》《圣何塞水星报》《丹佛
5/1/2024 4:12:56 PM
清源
宜家宣布向人工智能化转型:开发专属 AI 工具、总部员工需“必修”相关知识
宜家母公司英格卡集团近日声称将进行“人工智能转型”,要求宜家总部内 3500 余员工需“必修”AI 知识,同时还将拓展一系列 AI 业务。IT之家从新闻稿中获悉,宜家声称自家总部企业内 3000 名基层员工及 500 名主管都要接受各种 AI 训练,要求员工掌握基础 AI 常识,同时了解生成式 AI 工具的使用方法,宜家主管还要定期开会,研究“如何掌握 AI 趋势、设计商业战略”。而针对有数据科学、机器学习或大型语言模型领域硕博士学位的员工,宜家还推出了专项培训计划,以便发挥这些员工的 AI 相关能力。此外,宜家目
4/27/2024 8:13:08 AM
漾仔
GPT-4 化身黑客搞破坏,成功率 87%!OpenAI 要求保密提示词,网友复现 ing
91 行代码、1056 个 token,GPT-4 化身黑客搞破坏!测试成功率达 87%,单次成本仅 8.8 美元 (折合人民币约 63 元)。这就是来自伊利诺伊大学香槟分校研究团队的最新研究。他们设计了一个黑客智能体框架,研究了包括 GPT-4、GPT-3.5 和众多开源模型在内的 10 个模型。结果发现只有 GPT-4 能够在阅读 CVE 漏洞描述后,学会利用漏洞攻击,而其它模型成功率为 0。研究人员表示,OpenAI 已要求他们不要向公众发布该研究的提示词。网友们立马赶来围观了,有人还搞起了复现。这是怎么一回
4/21/2024 12:53:34 PM
清源
5亿个token之后,我们得出关于GPT的七条宝贵经验
ChatGPT 正确的使用姿势。自 ChatGPT 问世以来,OpenAI 一直被认为是全球生成式大模型的领导者。2023 年 3 月,OpenAI 官方宣布,开发者可以通过 API 将 ChatGPT 和 Whisper 模型集成到他们的应用程序和产品中。在 GPT-4 发布的同时 OpenAI 也开放了其 API。一年过去了,OpenAI 的大模型使用体验究竟如何,行业内的开发者怎么评价?最近,初创公司 Truss 的 CTO Ken Kantzer 发布了一篇题为《Lessons after a half-b
4/19/2024 4:08:00 PM
机器之心
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
数据
模型
机器人
谷歌
大模型
Midjourney
智能
开源
用户
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Stable Diffusion
马斯克
Gemini
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
3D
Sora
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
预测
人形机器人
百度
苹果
伟达
Transformer
深度学习
xAI
模态
字节跳动
Claude
大语言模型
搜索
具身智能
驾驶
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
干货合集
训练
应用
大型语言模型
科技
亚马逊
DeepMind
特斯拉
智能体