GPT
OpenAI 发布全新旗舰生成式 AI 模型 GPT-4o:语音对话更流畅,免费提供
感谢OpenAI 宣布推出其最新旗舰生成式 AI 模型 GPT-4o,该模型将在未来几周内分阶段集成至 OpenAI 的各个产品之中。最让人惊喜的是,GPT-4o 将免费提供给所有用户使用。综合 TechCrunch 等外媒报道,OpenAI 首席技术官穆里・穆拉蒂 (Muri Murati) 表示,GPT-4o 将提供与 GPT-4 同等水平的智能,但在文本、图像以及语音处理方面均取得了进一步提升。“GPT-4o 可以综合利用语音、文本和视觉信息进行推理,”穆拉蒂在 OpenAI 公司总部举行的主题演讲中表示。G
5/14/2024 1:25:13 AM
远洋
OpenAI 抓内鬼出奇招,阿尔特曼耍了所有人:GPT 搜索鸽了,改升级 GPT-4
感谢IT之家网友 咩咩洋、substring 的线索投递!最近 OpenAI 太反常,消息一会一变,直让人摸不着头脑。阿尔特曼宣布:5 月 13 日开发布会,不是 GPT-5,也不是盛传的 GPT 搜索引擎,改成对 ChatGPT 和 GPT-4 的升级~消息一出,大伙儿都蒙了。之前大张旗鼓给 SearchGPT 搜索引擎造势,域名、前端界面都准备好了,甚至已经有用户收到灰度测试。大有在谷歌 I / O 大会(5 月 14 日)前狙击一把谷歌核心业务的架子,就像春节期间用 Sora 狙击了谷歌大模型 Gemini
5/13/2024 1:30:24 PM
汪淼
消息称 OpenAI 将推出多模态人工智能数字助理:可语音对话、识别物体
据 The Information 报道,OpenAI 最近向部分客户展示了一款新型多模态人工智能模型,该模型能够进行语音对话和物体识别。有消息人士透露,这或许就是 OpenAI 计划在即将到来的 5 月 13 日正式发布的内容之一。图源 Pexels报道称,相比于 OpenAI 现有的独立图像识别和文本转语音模型,该新型模型能够更快、更准确地处理图像和音频信息。例如,它可以帮助客服人员“更好地理解来电者的语气语调,判断他们是否在使用讽刺语气”。理论上,该模型还能辅助学生学习数学知识,或翻译现实世界中的标志文字。不
5/12/2024 3:29:09 PM
远洋
未经许可重复使用原创文章训练模型,OpenAI 遭美国 8 家报纸出版商起诉
感谢据 CNBC 报道,当地时间 4 月 30 日,8 家美国报纸出版商在纽约的一家联邦法院对微软、OpenAI 提起诉讼,声称后者未经许可在生成式 AI 产品中重复使用这些出版商创作的文章,还将信息的不准确性归咎于出版商本身。图源 Pixabay根据 8 家出版商向美国纽约南区地方法院提交的诉状,ChatGPT 一直在“未经许可、未付款”的情况下,盗用了出版商数百万篇受版权保护的文章。IT之家查询发现,参与诉讼的出版商包括《纽约每日新闻》《芝加哥论坛报》《奥兰多哨兵报》《佛罗里达太阳哨兵报》《圣何塞水星报》《丹佛
5/1/2024 4:12:56 PM
清源
宜家宣布向人工智能化转型:开发专属 AI 工具、总部员工需“必修”相关知识
宜家母公司英格卡集团近日声称将进行“人工智能转型”,要求宜家总部内 3500 余员工需“必修”AI 知识,同时还将拓展一系列 AI 业务。IT之家从新闻稿中获悉,宜家声称自家总部企业内 3000 名基层员工及 500 名主管都要接受各种 AI 训练,要求员工掌握基础 AI 常识,同时了解生成式 AI 工具的使用方法,宜家主管还要定期开会,研究“如何掌握 AI 趋势、设计商业战略”。而针对有数据科学、机器学习或大型语言模型领域硕博士学位的员工,宜家还推出了专项培训计划,以便发挥这些员工的 AI 相关能力。此外,宜家目
4/27/2024 8:13:08 AM
漾仔
GPT-4 化身黑客搞破坏,成功率 87%!OpenAI 要求保密提示词,网友复现 ing
91 行代码、1056 个 token,GPT-4 化身黑客搞破坏!测试成功率达 87%,单次成本仅 8.8 美元 (折合人民币约 63 元)。这就是来自伊利诺伊大学香槟分校研究团队的最新研究。他们设计了一个黑客智能体框架,研究了包括 GPT-4、GPT-3.5 和众多开源模型在内的 10 个模型。结果发现只有 GPT-4 能够在阅读 CVE 漏洞描述后,学会利用漏洞攻击,而其它模型成功率为 0。研究人员表示,OpenAI 已要求他们不要向公众发布该研究的提示词。网友们立马赶来围观了,有人还搞起了复现。这是怎么一回
4/21/2024 12:53:34 PM
清源
5亿个token之后,我们得出关于GPT的七条宝贵经验
ChatGPT 正确的使用姿势。自 ChatGPT 问世以来,OpenAI 一直被认为是全球生成式大模型的领导者。2023 年 3 月,OpenAI 官方宣布,开发者可以通过 API 将 ChatGPT 和 Whisper 模型集成到他们的应用程序和产品中。在 GPT-4 发布的同时 OpenAI 也开放了其 API。一年过去了,OpenAI 的大模型使用体验究竟如何,行业内的开发者怎么评价?最近,初创公司 Truss 的 CTO Ken Kantzer 发布了一篇题为《Lessons after a half-b
4/19/2024 4:08:00 PM
机器之心
OpenAI 在东京开设亚洲首个办事处,将发布日语优化型 GPT-4 模型
感谢OpenAI 今日通过官方博客页面宣布,公司在亚洲的首个办事处落户日本东京,将业务扩展到亚洲。OpenAI 表示将致力于与当地政府、企业和研究机构合作,开发安全的人工智能工具,满足当地的独特需求。OpenAI 还将发布针对日语进行优化的 GPT-4 定制模型。与 GPT-4 Turbo 相比,它在日文文本方面的性能有所提高,运行速度最多可提高三倍。与此同时,该模型提高了翻译和总结日语文本的性能和成本效益。在当地最常用的英语学习 App“Speak”即采用了 OpenAI 提供的技术,在用户练习出错时讲解的速度提
4/15/2024 2:49:27 PM
清源
开启智能座舱AI时代,蔚来NOMI GPT端云多模态大模型正式上线
4月12日,蔚来宣布NOMI GPT正式开启推送。此次推送的更新是基于全新技术架构,为NOMI量身打造NOMI GPT端云多模态大模型。NOMI GPT包含自研多模态感知、自研认知中枢、情感引擎、多专家Agent,实现蔚来产品、服务、社区的全域贯通,提供更高效、愉悦的AI服务。升级NOMI GPT功能后,用户可以体验到大模型百科、无限趣聊、魔法氛围、趣玩表情、用车问答、AI场景生成在内的多项全新交互体验,享受智能AI赋能下的全新出行。此次NOMI GPT上线将同步陆续推送给搭载Banyan·榕智能系统的车型。自发布
4/12/2024 4:07:00 PM
新闻助手
OpenAI 宣布向 ChatGPT 付费用户开放新 GPT-4 Turbo 模型
感谢OpenAI 今日宣布,新 GPT-4 Turbo 现已向付费 ChatGPT 用户开放。与 1 月份相比,新版本提高了写作、数学、逻辑推理和编码的能力。GPT-4 Turbo 可在 ChatGPT Plus、Team、Enterprise 和 API 中使用。OpenAI 还表示,使用新版本写作时,响应会更直接、减少冗长内容,并使用更多的对话语言,他们还将继续优化使模型变得更好。据IT之家此前报道,GPT-4 Turbo 于 2023 年 11 月在 OpenAI 首届开发者大会上公开,支持 128k 上下文
4/12/2024 10:25:15 AM
沛霖(实习)
为什么要纯C语言手搓GPT-2,Karpathy回应网友质疑
Karpathy:for fun.几天前,前特斯拉 Autopilot 负责人、OpenAI 科学家 Andrej Karpathy 发布了一个仅用 1000 行代码即可在 CPU/fp32 上实现 GPT-2 训练的项目「llm.c」。llm.c 旨在让大模型(LM)训练变得简单 —— 使用纯 C 语言 / CUDA,不需要 245MB 的 PyTorch 或 107MB 的 cPython。例如,训练 GPT-2(CPU、fp32)仅需要单个文件中的大约 1000 行干净代码(clean code),可以立即编
4/11/2024 3:18:00 PM
机器之心
融合视觉能力,OpenAI 向开发人员提供 GPT-4 Turbo with Vision
感谢OpenAI 宣布,具有视觉能力的最新 GPT-4 Turbo 模型 GPT-4 Turbo with Vision 现已通过 OpenAI API 向开发人员普遍提供。据IT之家了解,该模型延续了 GPT-4 Turbo 系列 128,000 个 token 的窗口大小以及截止至 2023 年 12 月的知识库,最大的革新之处在于其新增的视觉理解能力。在过去,开发者需要调用不同的模型来处理文本和图像信息,而 GPT-4 Turbo with Vision 则将两者合二为一,极大简化了开发流程,并带来了广泛的应
4/10/2024 6:55:27 AM
远洋
苹果研究人员称其设备端模型 ReALM 性能优于 GPT-4,可大幅提升 Siri 智能程度
虽然目前 Siri 可以尝试描述信息中的图像,但效果并不稳定。不过,苹果公司并没有放弃人工智能领域的探索。在最近的一篇研究论文中,苹果的人工智能团队描述了一种可以显著提升 Siri 智能的模型,而且他们认为这个名为 ReALM 的模型在测试中优于 OpenAI 的知名语言模型 GPT-4.0。IT之家注意到,ReALM 的特别之处在于,它可以同时理解用户屏幕上的内容和正在进行的操作。论文将信息分为以下三种类型:屏幕实体:指的是当前显示在用户屏幕上的内容。对话实体:指的是与对话相关的内容。例如,用户说“打电话给妈妈”
4/2/2024 6:45:26 AM
远洋
优于人类专家,GPT-4 准确注释单细胞类型,成本低且稳健
编辑 | 萝卜皮GPT-4 是一种专为语音理解和生成而设计的大型语言模型。哥伦比亚大学梅尔曼公共卫生学院(Columbia University Mailman School of Public Health)的 Wenpin Hou 和杜克大学医学院(Duke University School of Medicine)的 Zhicheng Ji 证明,大语言模型 GPT-4 可以在单细胞 RNA 测序分析中使用标记基因信息准确注释细胞类型。「注释单个细胞的细胞类型的过程通常非常耗时,需要人类专家比较跨细胞簇的基
3/28/2024 6:44:00 PM
ScienceAI
GPTs 大翻车后,OpenAI 再宣布给开发者送钱!美国码农狂欢
【新智元导读】OpenAI 给开发者分钱了!就在刚刚,OpenAI 宣布 GPT 将「货币化」,所有美国开发者都可以得到收入分成,具体细节还在摸索。开发者欢呼:爱死 OpenAI 了!OpenAI,又要和开发者分钱了!就在刚刚,OpenAI 宣布,将要和一群美国开发者合作,测试 GPT 基于使用情况的收入。此举的目标,是创建一个充满活力的生态系统,让开发者的创造力和影响力得到回报。今年 1 月 GPT Store 正式上线的同时,OpenAI 曾在博客中表示:今年第一季度我们将推出 GPT 创建者收入计划。作为第一
3/28/2024 2:49:47 PM
清源
和 GPT-4 并列第一,LMSYS 基准测试显示 Claude-3 模型表现优异
根据 LMSYS Org 公布的最新基准测试报告,Claude-3 得分以微弱优势超越 GPT-4,成为该平台“最佳”大语言模型。IT之家首先介绍下 LMSYS Org,该机构是由加州大学伯克利分校、加州大学圣地亚哥分校和卡内基梅隆大学合作创立的研究组织。该机构推出 Chatbot Arena,这是一个针对大型语言模型(LLM) 的基准平台,以众包方式匿名、随机对抗测评大模型产品,其评级基于国际象棋等竞技游戏中广泛使用的 Elo 评分系统。评分结果通过用户投票产生,系统每次会随机选择两个不同的大模型机器人和用户聊天
3/28/2024 1:51:54 PM
故渊
OpenAI 的 GPT 商店审核失控:被指充斥侵权和垃圾内容
旨在提供从编程辅助到健身建议等各种功能的 GPT 模型的 OpenAI GPT 商店正面临质量和合规性问题。据 TechCrunch 调查,该商店存在大量涉嫌侵犯版权的 GPT 模型,例如未经授权生成迪士尼和漫威角色内容的“钢铁侠”GPT 或 “米奇老鼠”GPT。IT之家注意到,尽管 OpenAI 采用了结合自动检测和人工审查的审核制度,但大量的 GPT 模型显然逃过了审核。另一个问题是学术诚信,一些 GPT 模型声称可以绕过内容剽窃检测工具,助长抄袭行为。例如,有两个 GPT 模型,一个声称是高级的改写工具,另一
3/21/2024 5:23:48 PM
远洋
OpenAI CEO 阿尔特曼:GPT-4“有点糟糕”,今年将推出新模型
OpenAI 首席执行官萨姆・阿尔特曼 (Sam Altman) 在周一发布的与列克斯・弗里德曼 (Lex Fridman) 的访谈中表示,他们公司的人工智能模型 GPT-4 其实“有点糟糕(kinda sucks)”,阿尔特曼更期待即将到来的 GPT-5 能够真正配得上大家的期待。“我认为它有点糟糕,” 当被问及 GPT-4 及其最令人印象深刻的能力时,阿尔特曼说道,“展望未来几年,我们应该意识到我们现在拥有的工具将来看来会非常落后,这正是鞭策我们不断进步、创造更美好的未来的动力。”“别误会,我既不想贬低 GPT
3/19/2024 4:20:23 PM
远洋
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
马斯克
AI创作
智能体
英伟达
Anthropic
论文
代码
训练
AI新词
算法
Stable Diffusion
芯片
LLM
蛋白质
开发者
腾讯
Claude
苹果
生成式
AI for Science
Agent
神经网络
3D
机器学习
研究
xAI
生成
人形机器人
AI视频
计算
百度
Sora
GPU
AI设计
华为
工具
大语言模型
RAG
搜索
具身智能
字节跳动
大型语言模型
场景
深度学习
预测
视频生成
伟达
视觉
Transformer
AGI
架构
亚马逊
神器推荐
Copilot
DeepMind
特斯拉
应用