算法

做AI方向的设计，先了解这8个基础技术要点！

AI 除了作为工具增进我们的设计效率和质量外，也成为了许多产品设计增强自己竞争力，许多新解决方案应运而生的一种机会。作为设计师，我们也需要根据自己负责的产品范围了解一些基础的技术点，才能更好的设计出能够被用户理解的好产品，所以我会分享一些 AI 产品中常见的技术知识点。更多基础干货：.

6/10/2025 12:19:30 AM

林影落

谷歌AlphaEvolve发布！Gemini自进化AI破解数学难题，优化芯片与数据中心，训练速度飙升32.5%！

谷歌DeepMind发布了一项颠覆性研究成果——AlphaEvolve，一款结合Gemini大语言模型与进化算法的AI编码代理。这款系统不仅能自动发现和优化复杂算法，还在谷歌的数据中心、芯片设计和AI训练中展现了惊人实力，甚至助力Gemini模型自我优化，堪称AI领域的“左脚踩右脚”式突破。 AIbase深入剖析这一技术里程碑，揭示其核心原理与广泛影响。

5/15/2025 2:00:45 PM

AI在线

谷歌 DeepMind 推出 AlphaEvolve:AI 首次打破数学56年纪录，优化自身训练系统

谷歌 DeepMind 今日发布 AlphaEvolve，一款具备自我进化能力的人工智能代理，它不仅能自主发明复杂的计算机算法，还已广泛应用于谷歌的数据中心、芯片设计和 AI 模型训练中，取得了显著成果。 AlphaEvolve 将 Gemini 大语言模型与进化式优化方法结合，自动测试、改进并提升整个代码库，而不仅限于单一函数。该系统已在内部悄然运行一年多，提升了计算资源调度效率、加速了模型训练，并在数学研究上实现了突破。

5/15/2025 11:01:54 AM

AI在线

OpenAI 姚顺雨：“算法为王”终结，欢迎来到“产品思维”时代

回顾过去几十年，AI的发展几乎就是一部“顶级模型与新方法”迭代史。从DeepBlue击败象棋世界冠军、AlphaGo征服围棋、GPT-4刷爆各类考试榜单，到o1、R1等新一代模型横扫数学、编程、写作、操作等任务，每一次历史性突破的背后，都是训练方法、模型架构的根本性创新。这时候的游戏规则很简单：谁能发明更强的训练方法、模型架构，就能称霸榜单；谁能在ImageNet、GLUE、MMLU等benchmark上显著提升，就能写进教材、赢得引用。

5/6/2025 12:00:55 AM

问同一个问题 DeepSeek-r1 / Grok-3 / Gemini 2.0 / ChatGPT 的结果出乎意料...

最近在写 TS ，希望实现一个类似 .gitignore 的功能，已有代码如下：复制在 JS 层面使用正则匹配，显然不是什么好方案。于是整理代码和报错信息，找了四个免费的模型，问问思路。先说结论：DeepSeek-r1 思考了 298 秒，我一度以为其陷入了死循环，但最后其在第一轮给出的方案，被 Grok-3 、 Gemini 2.0 、 ChatGPT 统统认可是最优方案之一。

3/3/2025 12:00:00 AM

piperliu

简单示例提升DeepSeek-R1美国数学邀请赛AIME分数：以步骤为粒度对齐上下文学习与推理

仅需简单提示，满血版DeepSeek-R1美国数学邀请赛AIME分数再提高。上海交大、港中文、上海AI实验室等带来最新成果BoostStep对齐推理和上下文学习粒度，大幅提升上下文学习性能，突破少样本学习上限。图片大语言模型使用多步推理解决复杂数学问题，即先将复杂问题分解为多个步骤并逐步进行推理。

2/20/2025 12:09:22 PM

大模型超强内存优化：成本削减高达75%，性能不减弱！成果出自日本一初创AI公司之手；网友：电力可能够用了！

出品 | 51CTO技术栈（微信号：blog51cto）一项逆天的大模型优化技术来了！东京初创公司Sakana AI的研究人员开发了一种新技术，让大模型能够更有效地使用内存，不仅最多节省75%的内存占用，还甚至性能也有所提升！这种名为“通用Transformer内存”的技术使用特殊的神经网络优化LLM，保留重要的信息并丢弃冗余的细节。

12/18/2024 1:24:55 PM

RARE: 提升LLM推理准确性和事实完整性的检索增强框架思路浅尝

MCTS & rStar蒙特卡洛树搜索（MCTS）蒙特卡洛树搜索（MCTS）是一种用于解决复杂决策问题的算法，常用于游戏等领域。它的基本思想是通过构建一棵搜索树并模拟各种可能的行动来估计每个行动的价值。 MCTS的过程可以分为四个主要步骤：选择（Selection）：从根节点开始，根据某种策略（如UCT）遍历子节点，直到找到一个叶节点。

12/11/2024 8:12:24 AM

余俊晖

提升 1.5~20 倍吞吐量，字节豆包大模型团队与香港大学发布并开源全新 RLHF 框架

字节跳动豆包大模型团队与香港大学公开联合研究成果 —— HybridFlow。官方宣称，HybridFlow（开源项目名：veRL）是一个灵活且高效的大模型 RL 训练框架，兼容多种训练和推理框架，支持灵活的模型部署和多种 RL 算法实现。该框架采用混合编程模型，融合单控制器（Single-Controller）的灵活性和多控制器（Multi-Controller）的高效性，可更好实现和执行多种 RL 算法，显著提升训练吞吐量，降低开发和维护复杂度。

11/3/2024 3:24:59 PM

沛霖（实习）

豆包大模型团队开源RLHF框架，训练吞吐量最高提升20倍

强化学习（RL）对大模型复杂推理能力提升有关键作用，但其复杂的计算流程对训练和部署也带来了巨大挑战。近日，字节跳动豆包大模型团队与香港大学联合提出 HybridFlow。这是一个灵活高效的 RL/RLHF 框架，可显著提升训练吞吐量，降低开发和维护复杂度。

11/1/2024 2:44:00 PM

新闻助手

AI 赋能游戏开发：Valve 工程师借助 ChatGPT 改进《Deadlock》匹配算法

感谢Valve 工程师 Fletcher Dunn 昨日在社交媒体上分享了他使用 ChatGPT 改进《Deadlock》匹配算法的经历。他表示，ChatGPT 就像一个高级搜索引擎，能够帮助他找到所需的解决方案。Dunn 在《Deadlock》的测试阶段向 ChatGPT 提出了改进匹配算法的需求，ChatGPT 建议他使用匈牙利算法。Dunn 采纳了这个建议，并表示他对 ChatGPT 的强大功能感到惊讶。Dunn 认为，ChatGPT 的强大之处在于能够理解自然语言并提供相关信息。即使在专业领域如游戏开发，C

10/4/2024 6:40:36 PM

远洋

光学算法简化模拟人工智能训练

编辑 | 白菜叶研究人员开发了一系列模拟和其他非常规机器学习系统，期望它们将证明比今天的计算机更节能。但是训练这些人工智能来完成它们的任务一直是一个很大的绊脚石。NTT 设备技术实验室和东京大学的研究人员现在表示，他们已经提出了一种训练算法（NTT 上个月宣布），该算法对让这些系统实现其承诺大有帮助。他们的结果建立在光学模拟计算机上，代表了在获得研究人员长期以来从「非常规」计算机架构中寻求的潜在效率增益方面取得的进展。现代人工智能程序使用一种名为人工神经网络的受生物学启发的架构来执行图像识别或文本生成等任务。控制计

3/15/2023 4:27:00 PM

ScienceAI

资讯热榜

苹果发布全新Xcode 26开发者工具：内置ChatGPT先进AI功能那个男人回来了！Ilya现身多伦多大学毕业典礼：AI 像是用数字方式复制出来的大脑！不管你愿不愿意，AI都将深刻影响你的一生！首月 1 美元，ChatGPT Team 会员美区 / 英区 / 欧洲区 / 澳洲区迎优惠 ChatGPT 语音功能升级，实时翻译对话更自然流畅谷歌 Gemini 应用月下载量超越 ChatGPT，用户活跃度仍显不足长文本理解新王者?Gemini2.5Pro 击败 o3领跑 Fiction.Live 基准测试支持MCP！开源智能体开发框架 Rowboat：打造你的智能助手只需几分钟 DeepSeek前高管秘密创业，新AI Agent项目已获顶级VC押注

标签云

人工智能 AI OpenAI AIGC 模型 ChatGPT DeepSeek AI绘画数据谷歌机器人大模型 Midjourney 用户智能开源微软 GPT 学习 Meta 图像技术 AI创作 Gemini 论文马斯克 Stable Diffusion 算法代码英伟达 Anthropic 芯片生成式开发者蛋白质腾讯神经网络研究 3D 生成训练苹果计算智能体 Sora 机器学习 AI设计 AI for Science Claude GPU AI视频人形机器人华为搜索场景百度大语言模型 xAI 预测伟达深度学习 Transformer 字节跳动 Agent 模态具身智能神器推荐 LLaMA 文本视觉 Copilot 算力工具 LLM 驾驶 API 大型语言模型应用 RAG 亚马逊