文章列表
昂贵LLM的救星?Nature新研究提出新型忆阻器,比Haswell CPU高效460倍
前些天,OpenAI 发布了 ο1 系列模型,它那「超越博士水平的」强大推理性能预示着其必将在人们的生产生活中大有作为。但它的使用成本也很高,以至于 OpenAI 不得不限制每位用户的使用量:每位用户每周仅能给 o1-preview 发送 30 条消息,给 o1-mini 发送 50 条消息。实在是少!为了降低 LLM 的使用成本,研究者们已经想出了各式各样的方法。有些方法的目标是提升模型的效率,比如对模型进行量化或蒸馏,但这种方法往往也伴随着模型性能的下降。另一种思路则是提升运行这些模型的硬件——英伟达正是这一路
9/17/2024 1:59:00 PM
机器之心
陶哲轩提前实测满血版 OpenAI o1:能当研究生使唤
原来早在 8 月份,陶哲轩就已经用上了 OpenAI o1。还是现在大家都用不上的满血版本(眼泪不争气地从嘴角流出来)。提前批大佬是怎么玩最新天花板的呢?他向 o1 模型提出一个措辞模糊的数学问题,发现它竟然能成功识别出克莱姆定理。而且答案是“完全令人满意的”那种。当然,陶哲轩还做了一些其它测试,测下来总体体验就是:比以前的模型更牛,多堆点提示词表现还不错,但仍然会犯不小的错误,也没有产生啥自己的思想。陶哲轩是这样形容的:这种感觉,就像给一个平庸无奇但又有点小能力的研究生提供建议。不过,这已经比以前的模型有所改进,
9/16/2024 6:51:12 PM
清源
消息称 OpenAI 明年调整结构,转变为传统的营利性公司
《财富》(fortune)于 9 月 13 日发布博文,报道称山姆・阿尔特曼(Sam Altman)在最近周会上,向 OpenAI 公司员工宣布,将于明年调整颇为复杂的非营利性企业结构。报道称 OpenAI 在保留一个非营利部门之外,调整成为更传统的营利性公司。阿尔特曼表示 OpenAI 将摆脱非营利实体控制,转型为一家更为传统的营利性组织,但在周会上并未透露更多细节。AI在线援引消息源报道,OpenAI 一位发言人透露公司仍“致力于构建造福所有人的 AI”,并强调非营利性是“其使命的核心,并将持续存在”。Open
9/15/2024 1:54:12 PM
故渊
「LLM」这个名字不好,Karpathy认为不准确、马斯克怒批太愚蠢
在 AI 领域,几乎每个人都在谈论大型语言模型,其英文全称为 Large Language Models,简写为 LLM。因为 LLM 中有「Language」一词,因此,大家默认这种技术和语言密切相关。然而,知名 AI 大牛 Andrej Karpathy 却对此有着独特的见解:「大型语言模型(LLM)名字虽然带有语言二字,但它们其实与语言关系不大,这只是历史问题,更确切的名字应该是自回归 Transformer 或者其他。LLM 更多是一种统计建模的通用技术,它们主要通过自回归 Transformer 来模拟
9/15/2024 1:45:00 PM
机器之心
大厂AI设计实战!飞猪如何用AI打造100种不可思议的旅行?
以下视频来源于飞猪设计当视频在手机上无法加载,可前往PC查看。这 100 种全球不可思议的旅行玩法,是否有一个吸引了你,现在就想出发呢?
在这个人人都能营销的时代,传统的大市场、大高空、大观点的中心化营销方式正在逐步走向小团体、私空间、个性化的转变。曾经,一句响亮的 Slogan、一幅吸睛的大 KV、一段创意十足的 TVC 或许就能让消费者目不转睛,甚至占领心智。而如今,面对这类营销,对于消费者个体来说内心只会充满问号,who care?和我有什么关系?如果不能共情,那就请不要打扰我。
因为消费者早已不是信息的被动
9/15/2024 8:10:53 AM
团队Alibaba Design
OpenAI o1 非 GPT-4o 直接进化,在成本与性能上妥协
9 月 14 日消息,OpenAI 已经推出了新模型 OpenAI o1 的两大变体 ——o1-preview 与 o1-mini,这两款模型都有许多值得深入探讨的内容。人工智能专家西蒙・威利森(Simon Willison)专门发文,深入剖析了这些新模型背后的设计理念与实现细节,揭示了它们在技术上的独特优势与不足。威利森表示,o1 并不是简单的 GPT-4o 直接升级版,而是在强化“推理”能力的同时,做出了成本与性能上的权衡。1. 训练思维链OpenAI 的声明是一个很好的起点:“我们研发了一系列新型人工智能模型
9/14/2024 10:40:51 PM
小小
o1 模型完整思维链成 OpenAI 头号禁忌,问多了等着封号吧
警告!不要在 ChatGPT 里问最新 o1 模型是怎么思考的 ——只要尝试几次,OpenAI 就会发邮件威胁撤销你的使用资格。请停止此活动,确保您使用 ChatGPT 时符合我们的使用条款。违反此条款的行为可能导致失去 OpenAI o1 访问权限。大模型新范式 o1 横空出世不到 24 小时,就已经有不少用户反馈收到这封警告邮件,引起众人不满。有人反馈只要提示词里带“reasoning trace”、“show your chain of thought”等关键词就会收到警告。甚至完全避免出现关键词,使用其他手
9/14/2024 12:50:33 PM
汪淼
因类人通用推理、可辅助制作生物武器等因素,OpenAI o1 AI 模型归类为“中等风险”
科技媒体 The Decoder 昨日(9 月 13 日)发布博文,报道称在 OpenAI 自家的“防备框架”(Preparedness Framework)下,将最新发布的 o1 AI 模型归类为“中等风险”(medium risk)。防备框架简介AI在线曾于 2023 年 12 月报道,OpenAI 成立了新的“防备”(Preparedness)团队,并提出“防备框架”指导方针。防备团队将反复评估 OpenAI 最先进、尚未发布的 AI 模型,根据不同类型的感知风险评为四个等级,从低到高依次是“低”、“中”、“
9/14/2024 9:29:08 AM
故渊
OpenAI ChatGPT AI 聊天机器人新增“/picture”和“/search”指令
OpenAI 扩充 ChatGPT 系统快捷指令,新增“/picture”和“/search”,进一步改善用户的交互体验。AI在线附上操作方法如下:在与 ChatGPT 对话时,只需输入一个“/”(不含双引号),一个便捷的弹出窗口就会显示这些快捷选项。“/picture”该指令会调用 OpenAI 的文生图模型 DALL-E,即使用户没有具体的提示或想法,只需选择 / picture,也能为你生成有趣的图像。“/search”该指令会进入一个新的搜索模式,你输入的任何内容都会被视为搜索查询。即便用户没有输入任何内容
9/14/2024 9:13:18 AM
故渊
如何判断AI的输出是否正确?三个办法搞定!
在生成式 AI 工具如 ChatGPT 逐渐融入日常工作和生活的今天,很多人都在依赖 AI 来完成各种任务:撰写文案、编程、生成分析报告,甚至是做生活规划。虽然 AI 的应用场景越来越广泛,但它的输出并非每次都能符合预期。很多人在使用 AI 时会碰到这样的问题:AI 生成的内容到底靠不靠谱?它的输出是否可以完全信赖?如何判断 AI 给出的答案是正确的?
作为一名 AI 产品设计师,我也经常需要依赖 AI 工具来完成日常工作。经过无数次与 AI 的互动,我逐渐摸索出了三个简单有效的办法,可以帮助我们快速判断 AI 的
9/14/2024 7:50:39 AM
小普
超过人类博士的能力!OpenAI 全新发布o1模型!
OpenAI 发布新旗舰模型GPT-4o! 实时交互犹如真人,免费开放大家好,这里是和你们一起探索 AI 的花生。 阅读文章 .
9/14/2024 12:08:56 AM
数字生命卡兹克
训大模型为啥这么贵?专家:一半以上算力被浪费了
人工智能时代,大模型的发展带来了智能算力需求的大爆发。据估算,自 2012 年以来,AI 模型训练算力需求每 3~4 个月就翻一番,每年训练 AI 模型所需算力增长幅度高达 10 倍。同时,OpenAI 曾在 2020 年提出 Scaling law 定律。该定律指出,大模型的最终性能与计算量、模型参数量及训练数据量的大小密切相关。换言之,若要提升大模型的能力,就需要不断增加模型参数和训练数据量,这就需要部署大规模的训练集群,随着集群规模的不断扩大,训练成本也呈指数级增长。9月13日,在百度智能云举办的媒体技术沙龙
9/13/2024 6:55:00 PM
新闻助手
GPT未竟的革命,由o1接棒:或是LLM研究最重要的发现
天下武功唯快不破,但 OpenAI 不走寻常路,新出的 o1 系列宣告天下:我们更慢,但更强了。 o1 要花更多的时间思考问题,再做出反应,但在复杂推理层面直接窜了几个档位。 在国际数学奥林匹克 (IMO) 资格考试中,GPT-4o 仅正确解决了 13% 的问题,而 o1 得分为 83%。
9/13/2024 3:50:00 PM
刘洁
OpenAI o1深夜炸场,核心贡献者有哪些?我们看到了大量华人的名字
这篇文章系统梳理了 OpenAI o1模型背后的核心人才。今天凌晨,OpenAI 震撼发布 o1 大模型,酝酿已久的「草莓」终于面世。新模型能够进行复杂推理,具备真正的通用推理能力,可解决比以往的科学、代码和数学模型所能处理的更难的问题。它在一系列高难基准测试中展现出了超强实力,相比 GPT-4o 有巨大提升,甚至能在博士级别的科学问答环节上超越人类专家(详情请参见《刚刚,OpenAI 震撼发布 o1 大模型!强化学习突破 LLM 推理极限》)。虽然 o1 很强,但有趣的是,它并不会尝试去推理和解答「黎曼猜想」这类
9/13/2024 1:06:00 PM
机器之心
元象发布中国最大MoE开源大模型 落地应用登顶港台榜
元象XVERSE发布中国最大MoE开源模型:XVERSE-MoE-A36B,加速AI应用低成本部署,将国产开源提升至国际领先水平。 该模型总参数255B,激活参数36B,达到100B模型性能的「跨级」跃升,同时训练时间减少30%,推理性能提升100%,使每token成本大幅下降。 元象「高性能全家桶」系列全部开源,无条件免费商用,让海量中小企业、研究者和开发者能按需选择。
9/13/2024 11:58:00 AM
朱可轩
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
大模型领域的技术发展,今天起再次「从 1 开始」了。大语言模型还能向上突破,OpenAI 再次证明了自己的实力。北京时间 9 月 13 日午夜,OpenAI 正式公开一系列全新 AI 大模型,旨在专门解决难题。这是一个重大突破,新模型可以实现复杂推理,一个通用模型解决比此前的科学、代码和数学模型能做到的更难的问题。OpenAI 称,今天在 ChatGPT 和大模型 API 中新发布的是该系列中的第一款模型,而且还只是预览版 ——o1-preview。除了 o1,OpenAI 还展示了目前正在开发的下次更新的评估。o
9/13/2024 8:47:00 AM
机器之心
安卓版谷歌 Gemini Live 免费上线,开启在线 AI 语音畅聊
科技媒体 9to5Google 昨日(9 月 12 日)发布博文,报道谷歌在 1 个月前面向 Advanced 订阅用户推出后,正逐步面向所有安卓用户免费开放 Gemini Live。AI在线曾于 8 月报道,谷歌在 Pixel 9 系列手机发布会上,发布了 Gemini Live,该服务提供了一种移动对话体验,让用户和 Gemini 展开自由流畅的对话。Gemini Live 可以说是对标 OpenAI ChatGPT 最新上线的 Advanced Voice 模式(限量 Alpha 测试),采用了增强型语音引擎
9/13/2024 8:33:38 AM
故渊
文生图 AI Midjourney 雄心:7.0 版未来 1-2 月登场、开发新图像编辑器、探索 3D 系统、踏足硬件领域
科技媒体 The Decoder 昨日(9 月 12 日)发布博文,报道称在最近的“Office Hours”活动中,Midjourney 创始人兼首席执行官 David Holz 在 Discord 分享了当前项目的最新进展,并回答了社区的提问。Midjourney 7.0 版本Holz 更新了 Midjourney 7.0 版本时间表,表示将会在未来 1-2 月内发布。让更多人体验 MidjourneyHolz 表示公司并不急于推出新的 AI 模型,而是提高现有技术的易用性,让工具深入融入到专业人士的日常工作中
9/13/2024 7:36:39 AM
故渊