文章列表

分类

标签

昂贵LLM的救星？Nature新研究提出新型忆阻器，比Haswell CPU高效460倍

前些天，OpenAI 发布了 ο1 系列模型，它那「超越博士水平的」强大推理性能预示着其必将在人们的生产生活中大有作为。但它的使用成本也很高，以至于 OpenAI 不得不限制每位用户的使用量：每位用户每周仅能给 o1-preview 发送 30 条消息，给 o1-mini 发送 50 条消息。实在是少！为了降低 LLM 的使用成本，研究者们已经想出了各式各样的方法。有些方法的目标是提升模型的效率，比如对模型进行量化或蒸馏，但这种方法往往也伴随着模型性能的下降。另一种思路则是提升运行这些模型的硬件——英伟达正是这一路

9/17/2024 1:59:00 PM

机器之心

陶哲轩提前实测满血版 OpenAI o1：能当研究生使唤

原来早在 8 月份，陶哲轩就已经用上了 OpenAI o1。还是现在大家都用不上的满血版本（眼泪不争气地从嘴角流出来）。提前批大佬是怎么玩最新天花板的呢？他向 o1 模型提出一个措辞模糊的数学问题，发现它竟然能成功识别出克莱姆定理。而且答案是“完全令人满意的”那种。当然，陶哲轩还做了一些其它测试，测下来总体体验就是：比以前的模型更牛，多堆点提示词表现还不错，但仍然会犯不小的错误，也没有产生啥自己的思想。陶哲轩是这样形容的：这种感觉，就像给一个平庸无奇但又有点小能力的研究生提供建议。不过，这已经比以前的模型有所改进，

9/16/2024 6:51:12 PM

清源

消息称 OpenAI 明年调整结构，转变为传统的营利性公司

《财富》（fortune）于 9 月 13 日发布博文，报道称山姆・阿尔特曼（Sam Altman）在最近周会上，向 OpenAI 公司员工宣布，将于明年调整颇为复杂的非营利性企业结构。报道称 OpenAI 在保留一个非营利部门之外，调整成为更传统的营利性公司。阿尔特曼表示 OpenAI 将摆脱非营利实体控制，转型为一家更为传统的营利性组织，但在周会上并未透露更多细节。AI在线援引消息源报道，OpenAI 一位发言人透露公司仍“致力于构建造福所有人的 AI”，并强调非营利性是“其使命的核心，并将持续存在”。Open

9/15/2024 1:54:12 PM

故渊

「LLM」这个名字不好，Karpathy认为不准确、马斯克怒批太愚蠢

在 AI 领域，几乎每个人都在谈论大型语言模型，其英文全称为 Large Language Models，简写为 LLM。因为 LLM 中有「Language」一词，因此，大家默认这种技术和语言密切相关。然而，知名 AI 大牛 Andrej Karpathy 却对此有着独特的见解：「大型语言模型（LLM）名字虽然带有语言二字，但它们其实与语言关系不大，这只是历史问题，更确切的名字应该是自回归 Transformer 或者其他。LLM 更多是一种统计建模的通用技术，它们主要通过自回归 Transformer 来模拟

9/15/2024 1:45:00 PM

机器之心

大厂AI设计实战！飞猪如何用AI打造100种不可思议的旅行？

以下视频来源于飞猪设计当视频在手机上无法加载，可前往PC查看。这 100 种全球不可思议的旅行玩法，是否有一个吸引了你，现在就想出发呢？在这个人人都能营销的时代，传统的大市场、大高空、大观点的中心化营销方式正在逐步走向小团体、私空间、个性化的转变。曾经，一句响亮的 Slogan、一幅吸睛的大 KV、一段创意十足的 TVC 或许就能让消费者目不转睛，甚至占领心智。而如今，面对这类营销，对于消费者个体来说内心只会充满问号，who care？和我有什么关系？如果不能共情，那就请不要打扰我。因为消费者早已不是信息的被动

9/15/2024 8:10:53 AM

团队Alibaba Design

OpenAI o1 非 GPT-4o 直接进化，在成本与性能上妥协

9 月 14 日消息，OpenAI 已经推出了新模型 OpenAI o1 的两大变体 ——o1-preview 与 o1-mini，这两款模型都有许多值得深入探讨的内容。人工智能专家西蒙・威利森（Simon Willison）专门发文，深入剖析了这些新模型背后的设计理念与实现细节，揭示了它们在技术上的独特优势与不足。威利森表示，o1 并不是简单的 GPT-4o 直接升级版，而是在强化“推理”能力的同时，做出了成本与性能上的权衡。1. 训练思维链OpenAI 的声明是一个很好的起点：“我们研发了一系列新型人工智能模型

9/14/2024 10:40:51 PM

小小

o1 模型完整思维链成 OpenAI 头号禁忌，问多了等着封号吧

警告！不要在 ChatGPT 里问最新 o1 模型是怎么思考的 ——只要尝试几次，OpenAI 就会发邮件威胁撤销你的使用资格。请停止此活动，确保您使用 ChatGPT 时符合我们的使用条款。违反此条款的行为可能导致失去 OpenAI o1 访问权限。大模型新范式 o1 横空出世不到 24 小时，就已经有不少用户反馈收到这封警告邮件，引起众人不满。有人反馈只要提示词里带“reasoning trace”、“show your chain of thought”等关键词就会收到警告。甚至完全避免出现关键词，使用其他手

9/14/2024 12:50:33 PM

汪淼

因类人通用推理、可辅助制作生物武器等因素，OpenAI o1 AI 模型归类为“中等风险”

科技媒体 The Decoder 昨日（9 月 13 日）发布博文，报道称在 OpenAI 自家的“防备框架”（Preparedness Framework）下，将最新发布的 o1 AI 模型归类为“中等风险”（medium risk）。防备框架简介AI在线曾于 2023 年 12 月报道，OpenAI 成立了新的“防备”（Preparedness）团队，并提出“防备框架”指导方针。防备团队将反复评估 OpenAI 最先进、尚未发布的 AI 模型，根据不同类型的感知风险评为四个等级，从低到高依次是“低”、“中”、“

9/14/2024 9:29:08 AM

故渊

OpenAI ChatGPT AI 聊天机器人新增“/picture”和“/search”指令

OpenAI 扩充 ChatGPT 系统快捷指令，新增“/picture”和“/search”，进一步改善用户的交互体验。AI在线附上操作方法如下：在与 ChatGPT 对话时，只需输入一个“/”（不含双引号），一个便捷的弹出窗口就会显示这些快捷选项。“/picture”该指令会调用 OpenAI 的文生图模型 DALL-E，即使用户没有具体的提示或想法，只需选择 / picture，也能为你生成有趣的图像。“/search”该指令会进入一个新的搜索模式，你输入的任何内容都会被视为搜索查询。即便用户没有输入任何内容

9/14/2024 9:13:18 AM

故渊

如何判断AI的输出是否正确？三个办法搞定！

在生成式 AI 工具如 ChatGPT 逐渐融入日常工作和生活的今天，很多人都在依赖 AI 来完成各种任务：撰写文案、编程、生成分析报告，甚至是做生活规划。虽然 AI 的应用场景越来越广泛，但它的输出并非每次都能符合预期。很多人在使用 AI 时会碰到这样的问题：AI 生成的内容到底靠不靠谱？它的输出是否可以完全信赖？如何判断 AI 给出的答案是正确的？作为一名 AI 产品设计师，我也经常需要依赖 AI 工具来完成日常工作。经过无数次与 AI 的互动，我逐渐摸索出了三个简单有效的办法，可以帮助我们快速判断 AI 的

9/14/2024 7:50:39 AM

小普

超过人类博士的能力！OpenAI 全新发布o1模型！

OpenAI 发布新旗舰模型GPT-4o！实时交互犹如真人，免费开放大家好，这里是和你们一起探索 AI 的花生。阅读文章 .

9/14/2024 12:08:56 AM

数字生命卡兹克

训大模型为啥这么贵？专家：一半以上算力被浪费了

人工智能时代，大模型的发展带来了智能算力需求的大爆发。据估算，自 2012 年以来，AI 模型训练算力需求每 3~4 个月就翻一番，每年训练 AI 模型所需算力增长幅度高达 10 倍。同时，OpenAI 曾在 2020 年提出 Scaling law 定律。该定律指出，大模型的最终性能与计算量、模型参数量及训练数据量的大小密切相关。换言之，若要提升大模型的能力，就需要不断增加模型参数和训练数据量，这就需要部署大规模的训练集群，随着集群规模的不断扩大，训练成本也呈指数级增长。9月13日，在百度智能云举办的媒体技术沙龙

9/13/2024 6:55:00 PM

新闻助手

GPT未竟的革命，由o1接棒：或是LLM研究最重要的发现

天下武功唯快不破，但 OpenAI 不走寻常路，新出的 o1 系列宣告天下：我们更慢，但更强了。 o1 要花更多的时间思考问题，再做出反应，但在复杂推理层面直接窜了几个档位。在国际数学奥林匹克 (IMO) 资格考试中，GPT-4o 仅正确解决了 13% 的问题，而 o1 得分为 83%。

9/13/2024 3:50:00 PM

刘洁

OpenAI o1深夜炸场，核心贡献者有哪些？我们看到了大量华人的名字

这篇文章系统梳理了 OpenAI o1模型背后的核心人才。今天凌晨，OpenAI 震撼发布 o1 大模型，酝酿已久的「草莓」终于面世。新模型能够进行复杂推理，具备真正的通用推理能力，可解决比以往的科学、代码和数学模型所能处理的更难的问题。它在一系列高难基准测试中展现出了超强实力，相比 GPT-4o 有巨大提升，甚至能在博士级别的科学问答环节上超越人类专家（详情请参见《刚刚，OpenAI 震撼发布 o1 大模型！强化学习突破 LLM 推理极限》）。虽然 o1 很强，但有趣的是，它并不会尝试去推理和解答「黎曼猜想」这类

9/13/2024 1:06:00 PM

机器之心

元象发布中国最大MoE开源大模型落地应用登顶港台榜

元象XVERSE发布中国最大MoE开源模型：XVERSE-MoE-A36B，加速AI应用低成本部署，将国产开源提升至国际领先水平。该模型总参数255B，激活参数36B，达到100B模型性能的「跨级」跃升，同时训练时间减少30%，推理性能提升100%，使每token成本大幅下降。元象「高性能全家桶」系列全部开源，无条件免费商用，让海量中小企业、研究者和开发者能按需选择。

9/13/2024 11:58:00 AM

朱可轩

刚刚，OpenAI震撼发布o1大模型！强化学习突破LLM推理极限

大模型领域的技术发展，今天起再次「从 1 开始」了。大语言模型还能向上突破，OpenAI 再次证明了自己的实力。北京时间 9 月 13 日午夜，OpenAI 正式公开一系列全新 AI 大模型，旨在专门解决难题。这是一个重大突破，新模型可以实现复杂推理，一个通用模型解决比此前的科学、代码和数学模型能做到的更难的问题。OpenAI 称，今天在 ChatGPT 和大模型 API 中新发布的是该系列中的第一款模型，而且还只是预览版 ——o1-preview。除了 o1，OpenAI 还展示了目前正在开发的下次更新的评估。o

9/13/2024 8:47:00 AM

机器之心

安卓版谷歌 Gemini Live 免费上线，开启在线 AI 语音畅聊

科技媒体 9to5Google 昨日（9 月 12 日）发布博文，报道谷歌在 1 个月前面向 Advanced 订阅用户推出后，正逐步面向所有安卓用户免费开放 Gemini Live。AI在线曾于 8 月报道，谷歌在 Pixel 9 系列手机发布会上，发布了 Gemini Live，该服务提供了一种移动对话体验，让用户和 Gemini 展开自由流畅的对话。Gemini Live 可以说是对标 OpenAI ChatGPT 最新上线的 Advanced Voice 模式（限量 Alpha 测试），采用了增强型语音引擎

9/13/2024 8:33:38 AM

故渊

文生图 AI Midjourney 雄心：7.0 版未来 1-2 月登场、开发新图像编辑器、探索 3D 系统、踏足硬件领域

科技媒体 The Decoder 昨日（9 月 12 日）发布博文，报道称在最近的“Office Hours”活动中，Midjourney 创始人兼首席执行官 David Holz 在 Discord 分享了当前项目的最新进展，并回答了社区的提问。Midjourney 7.0 版本Holz 更新了 Midjourney 7.0 版本时间表，表示将会在未来 1-2 月内发布。让更多人体验 MidjourneyHolz 表示公司并不急于推出新的 AI 模型，而是提高现有技术的易用性，让工具深入融入到专业人士的日常工作中

9/13/2024 7:36:39 AM

故渊

资讯热榜

OpenAI发布企业AI浪潮领先指南：十大核心洞察推理大模型机制解析！为什么Qwen3要把脑子一分为二？华纳兄弟发起 “反击战”：起诉AI图像生成公司Midjourney 谷歌新 AI “Nano Banana” 一周吸引千万用户，图像编辑轻松搞定！ OpenAI 挥剑指向 LinkedIn，将于2026年推出 AI 招聘平台 KakaoTalk将集成ChatGPT功能韩国聊天应用迎来AI升级华纳兄弟探索公司起诉 Midjourney侵犯其版权角色 MIT 报告揭示 95% 企业 GenAI 项目失败，批评者称其过于简化

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek AI绘画谷歌机器人数据大模型 Midjourney 开源智能 Meta 用户微软 GPT 学习技术图像 Gemini 马斯克智能体 AI创作 AI新词 Anthropic 英伟达论文训练代码算法 LLM Stable Diffusion 芯片蛋白质腾讯开发者 Claude 苹果 AI for Science Agent 生成式神经网络机器学习 3D 研究 xAI 生成人形机器人 AI视频计算百度 Sora 工具 GPU 华为 RAG AI设计大语言模型字节跳动具身智能搜索大型语言模型场景深度学习视频生成预测视觉 AGI 伟达架构 Transformer 神器推荐亚马逊特斯拉编程 Copilot DeepMind

文章列表

昂贵LLM的救星？Nature新研究提出新型忆阻器，比Haswell CPU高效460倍

陶哲轩提前实测满血版 OpenAI o1：能当研究生使唤

消息称 OpenAI 明年调整结构，转变为传统的营利性公司

「LLM」这个名字不好，Karpathy认为不准确、马斯克怒批太愚蠢

大厂AI设计实战！飞猪如何用AI打造100种不可思议的旅行？

OpenAI o1 非 GPT-4o 直接进化，在成本与性能上妥协

o1 模型完整思维链成 OpenAI 头号禁忌，问多了等着封号吧

因类人通用推理、可辅助制作生物武器等因素，OpenAI o1 AI 模型归类为“中等风险”

OpenAI ChatGPT AI 聊天机器人新增“/picture”和“/search”指令

如何判断AI的输出是否正确？三个办法搞定！

超过人类博士的能力！OpenAI 全新发布o1模型！

训大模型为啥这么贵？专家：一半以上算力被浪费了

GPT未竟的革命，由o1接棒：或是LLM研究最重要的发现

OpenAI o1深夜炸场，核心贡献者有哪些？我们看到了大量华人的名字

元象发布中国最大MoE开源大模型 落地应用登顶港台榜

刚刚，OpenAI震撼发布o1大模型！强化学习突破LLM推理极限

安卓版谷歌 Gemini Live 免费上线，开启在线 AI 语音畅聊

文生图 AI Midjourney 雄心：7.0 版未来 1-2 月登场、开发新图像编辑器、探索 3D 系统、踏足硬件领域

元象发布中国最大MoE开源大模型落地应用登顶港台榜