大模型

六大模型决战高考数学新一卷：豆包、元宝并列第一，OpenAI o3竟惨败垫底

又是一年高考时。这届考生上午刚经历了抽象作文的洗礼，下午又被数学无情创飞。考试一结束，「高考数学」、「新一卷数学大题难」等词条就火速冲上微博热搜，考生们在评论区集体「哀嚎」：「大题写到怀疑人生」、「选择填空送分，大题送命」。

6/8/2025 12:23:06 PM

机器之心

每天自动获取日历邮件摘要：谷歌 Gemini 安卓版应用新增“Scheduled Actions”功能

谷歌Gemini安卓版应用新增“计划操作”功能，支持预设指令自动执行任务，如获取日历邮件摘要、生成小说大纲等。即日起向Google AI Pro/Ultra会员开放。#谷歌Gemini# #自动化任务#

6/7/2025 9:34:56 AM

漾仔

谷歌 Gemini 上线“计划操作”功能：动动手就能让“AI 秘书”帮你完成任务

“计划操作”目前仅向订阅 Gemini 付费服务的用户开放，包括 Google AI Pro、Ultra，以及 Google Workspace 的商业和教育版用户。

6/7/2025 8:35:43 AM

清源

Dify工具插件开发和智能体开发全流程实战

前言Dify是一款开源的大语言模型应用开发平台，旨在降低AI应用的开发门槛，帮助开发者和企业快速构建、部署及管理生成式AI应用。 Dify自1.0.0引入全新插件化架构，模型（Models）与工具（Tools）迁移为插件（Plugins），引入 Agent 策略（Agent Strategies）、扩展（Extensions）类型插件和插件集（Bundles）。通过全新的插件机制，能够增强 AI 应用的感知和执行能力，拓宽AI在软件操作领域的应用能力。

6/6/2025 10:01:25 AM

AI大模型应用开发

AI Agent 产品交互设计：设计模式与案例分析

作者 | 贾思玉、亢江妹或许你还记得 ChatGPT 问世时的轰动，第一次使用 DeepSeek R1 的兴奋和激动也历历在目。 AI Agent 发展一日千里，今年以来，几乎每个月都有新的 AI Agent 产品发布，现有产品也不断更新换代，让人目不暇接。本文将从体验设计视角，来看看当下热门的 AI Agent 产品，如 Manus、Flowith、Gemini Deep Research、Cursor、Devin 等，分析 Agent 产品面临的设计挑战，探讨有效的交互设计模式，以及如何打造高效、易用、友好的 Agent 交互体验。

6/6/2025 9:46:57 AM

Thoughtworks洞见

LLM 协作革命：Group Think 如何重塑推理边界

大家好，我是肆〇柒。今天和大家聊聊 Group Think。顾名思义，它通过让单个 LLM 模拟多个并行推理智能体，并以 token 级别的细粒度协作，提出了推理协作的新范式。

6/6/2025 8:57:42 AM

肆零柒

大模型公司挖墙脚哪家强？报告：Anthropic人才吸引力是OpenAI的8倍，留存率达80%

大模型公司挖墙脚哪家强，Anthropic才是最大赢家？不仅顶尖AI人才的留存率达到80%，而且工程师从OpenAI跳槽到Anthropic的可能性是从Anthropic转投OpenAI的8倍。不止OpenAI，大型科技公司也是Anthropic主要的人才猎场。

6/6/2025 12:33:00 AM

DeepSeek 等模型训练所依赖的合成数据，BARE 提出了新思路

大家好，我是肆〇柒，在AI圈，大型语言模型（LLM）的训练对高质量、多样化数据的需求日益增长。从去年到现在，一些模型在发布的时候，会有论文或者技术报告，里面多多少少都会提及合成数据，并且在多数情况下，合成数据的效果并不差。比如，我所看到的报告中，使用了合成数据的模型如下盘点（应该会有遗漏，它并不完整）。

6/4/2025 9:15:16 AM

肆零柒

微软再放LLM量化大招！原生4bit量化，成本暴减，性能几乎0损失

最近，微软亚研院的研究团队开源了原生1bit精度的大模型：BitNet b1.58 2B4T。还没过几天，原班人马带着第二代BitNet v2来了！这次性能几乎0损失，但占用内存和计算成本显著降低！

6/3/2025 8:49:00 AM

函数向量对齐技术，让大模型持续学习不“失忆”丨ICLR 2025

LLMs为什么总是灾难性遗忘？原来是功能激活在搞怪。最近来自中国科学技术大学、香港城市大学和浙江大学的联合研究团队，通过对多个语言模型、任务序列和评估指标的系统分析，终于破解了LLMs的灾难性遗忘之谜——遗忘行为具有高度的模型依赖性，而导致遗忘发生的本质却是功能激活的变化。

6/3/2025 8:35:00 AM

AI记忆系统首获统一框架！6大操作让大模型拥有人类记忆能力

当AI不再只是“即兴发挥”的对话者，而开始拥有“记忆力”——我们该如何重新定义智能？来自香港中文大学、爱丁堡大学、香港科技大学与华为爱丁堡研究中心的研究团队联合发布了一项关于AI记忆机制的系统性综述，旨在在大模型时代背景下，重新审视并系统化理解智能体的记忆构建与演化路径。大语言模型（LLMs）正快速从纯文本生成工具演化为具有长期交互能力的智能体。

6/3/2025 8:32:00 AM

为什么非要做Agent？我用传统方法也能实现啊！

"我硬编码10分钟就能搞定的功能，你用Agent折腾半天还不稳定，图啥？ " 技术群里，老王又开始质疑我们的Agent项目了。作为一个写了15年代码的资深工程师，他的话很有代表性。

6/3/2025 6:39:54 AM

大数据AI智能圈

AI大模型踩过的坑，每一个都价值千万

看着你们公司几十台服务器嗡嗡作响，显卡温度报警声此起彼伏，老板又在催问"大模型什么时候能上线？ " 这个熟悉的场景，是不是让你想起了那句话——"理想很丰满，现实很骨感"。训练一个千亿参数的大模型，好比盖一栋摩天大楼。

6/3/2025 6:30:05 AM

大数据AI智能圈

基于Gemini与Qdrant构建生产级RAG管道：设计指南与代码实践

一、RAG技术的核心价值与应用场景在人工智能领域，检索增强生成（Retrieval-Augmented Generation, RAG）正成为解决大语言模型（LLM）知识更新滞后、生成内容不可追溯等问题的关键技术。传统的微调（Fine-Tuning）方法将知识固化在模型参数中，难以应对动态领域的快速变化；而RAG通过将检索与生成解耦，实现了知识的实时更新与可追溯性，尤其适用于政策频繁变动、对准确性要求极高的场景，如医疗、法律和航空管理。本文以构建机场智能助理为例，结合Google的Gemini多模态模型与Qdrant向量数据库，详细阐述如何设计并实现一个高可靠、可扩展的生产级RAG管道。

6/3/2025 2:55:00 AM

大模型之路

阿里发布 QwenLong-L1 超长文本杀器！已开源、支持 120k 长上下文、具备“翻书回溯”能力

业界普遍认为AI上下文越长越好，但这存在一个核心矛盾：模型能“吞下”海量信息，却难以真正“消化”。面对长文，它们会忘记要点、无法深入推理，这已成为一大瓶颈。例如，AI 能记住第1页的内容，同时理解第100页的观点，并将两者联系起来进行推理吗？

6/3/2025 12:00:09 AM

Anthropic重磅开源！“电路追踪”工具解锁AI大脑，揭秘大模型决策全过程

近年来，大语言模型（LLM）的快速发展为人工智能领域带来了前所未有的突破，但其内部决策过程却常常被视为“黑盒子”，难以捉摸。 5月29日，AI研究领域的明星公司Anthropic发布了一项重大开源成果——“电路追踪”(Circuit Tracing)工具，为破解大模型的内部工作机制提供了全新视角。这一工具不仅能帮助研究人员深入探索AI的“思考”过程，还为推动更透明、可控的AI发展迈出了重要一步。

5/30/2025 10:01:14 AM

AI在线

博士级AI智能体写的论文，首次登上顶会ACL！人类作者只是监工

有个叫Zochi的AI系统写了一篇研究论文，并且被顶级学术会议ACL 2025的主会场接受了！ ACL是自然语言处理（NLP）领域里最顶尖的会议之一。 Zochi是Intology AI开发的首个博士级智能体，就像一个从头到尾完成科学研究「AI科学家」。

5/30/2025 9:15:00 AM

百度智能云千帆大模型平台、文小言接入DeepSeek-R1-0528模型

百度智能云千帆大模型平台正式上架了 DeepSeek 最新的 R1-0528大模型。这一重要更新于5月29日上线，旨在为企业和用户提供更强大的 AI 能力和支持。千帆模型开发平台不仅上架了这一全新大模型，还同步推出了一系列实用功能，包括批量推理、模型评估、推理日志挖掘分析以及模型蒸馏。

5/30/2025 9:05:04 AM

AI在线

资讯热榜

腾讯云大模型升级公告:DeepSeek-V3/ DeepSeek-R1模型将于24日正式下线 OpenAI低调更新GPT4o模型，多项能力反超DeepSeek DeepSeek-R1 登顶 Hugging Face：以10000 赞力压 150 万个模型自有歪果仁为DeepSeek「辩经」：揭穿围绕DeepSeek的谣言 IBM 强化 watsonx.ai:DeepSeek-R1蒸馏版 Llama 模型上线东风日产N7首款接入DeepSeek大模型，实现智能化人机交互腾讯云上线DeepSeek全系API接口并打通联网搜索微信搜索接入DeepSeek大模型称AI不会使用朋友圈聊天等信息

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI绘画大模型机器人数据 AI新词 Midjourney 开源 Meta 微软智能用户 GPT 学习技术智能体 Gemini 马斯克 Anthropic 英伟达图像 AI创作训练 LLM 论文代码算法苹果 AI for Science Agent Claude 腾讯芯片 Stable Diffusion 蛋白质具身智能开发者 xAI 生成式神经网络机器学习人形机器人 3D AI视频 RAG 大语言模型研究百度 Sora 生成 GPU 工具华为字节跳动计算 AGI 大型语言模型 AI设计搜索生成式AI 视频生成 DeepMind 特斯拉场景 AI模型深度学习亚马逊架构 Transformer MCP 编程视觉预测