大模型
DeepSeek前高管秘密创业,新AI Agent项目已获顶级VC押注
据虎嗅消息,国内大模型公司DeepSeek的一位核心高管已于半年前悄然离职创业,并计划在2025年圣诞节前后推出其首款Agent产品。 有接近人士向虎嗅透露,该高管曾担任DeepSeek的“CTO”角色,不过也有知情人指出,DeepSeek内部架构中并无明确设置“CTO”职位。 该职位在名义上可能并不存在,但确有高管承担类似的技术统筹与研发决策职责。
6/10/2025 10:00:32 AM
AI在线
七种方式让你的AI编码结果更靠谱
译者 | 核子可乐审校 | 重楼企业在积极引入AI的同时,也希望雇用更多工程师,期望开发者能够借AI之力将产出“提升10倍”。 但要真正高效运用AI编码助手,其中也有不少门道。 首先是AI编码助手的固有局限,其存在大量不确定性,因此容易引发种种难以避免的意外行为,例如随机删除代码或引入逻辑错误。
6/10/2025 8:30:50 AM
核子可乐
多模态推理模型(LMRM):从感知到推理的演变
大家好,我是肆〇柒。 当下,人工智能正以前所未有的速度改变着我们的生活与工作方式。 其中,推理作为人工智能的核心能力之一,赋予了智能体在复杂环境中做出决策、得出结论以及进行知识泛化的能力。
6/10/2025 3:30:00 AM
肆零柒
高考作文“抽象”上热搜,大模型来战能拿几分?
6月7日上午,2025年全国高考正式拉开帷幕。 首场语文考试结束后,作文题目便迅速成为众人讨论的焦点。 有网友表示,今年的高考作文太难了,甚至是有些抽象。
6/9/2025 3:23:26 PM
Yu
谷歌 Gemini 应用月下载量超越 ChatGPT,用户活跃度仍显不足
自2025年4月底以来,谷歌的 Gemini 应用在全球 Android 下载量上超过了 ChatGPT,每周的安装量达到了600万以上。 然而,ChatGPT 在同一时期的下载量则下降到了300万以下。 这一变化可能得益于谷歌通过其搜索引擎及其他服务的广泛推广,从而为 Gemini 吸引了大量用户。
6/9/2025 11:01:00 AM
AI在线
六大模型决战高考数学新一卷:豆包、元宝并列第一,OpenAI o3竟惨败垫底
又是一年高考时。 这届考生上午刚经历了抽象作文的洗礼,下午又被数学无情创飞。 考试一结束,「高考数学」、「新一卷数学大题 难」等词条就火速冲上微博热搜,考生们在评论区集体「哀嚎」:「大题写到怀疑人生」、「选择填空送分,大题送命」。
6/8/2025 12:23:06 PM
机器之心
每天自动获取日历邮件摘要:谷歌 Gemini 安卓版应用新增“Scheduled Actions”功能
谷歌Gemini安卓版应用新增“计划操作”功能,支持预设指令自动执行任务,如获取日历邮件摘要、生成小说大纲等。即日起向Google AI Pro/Ultra会员开放。#谷歌Gemini# #自动化任务#
6/7/2025 9:34:56 AM
漾仔
谷歌 Gemini 上线“计划操作”功能:动动手就能让“AI 秘书”帮你完成任务
“计划操作”目前仅向订阅 Gemini 付费服务的用户开放,包括 Google AI Pro、Ultra,以及 Google Workspace 的商业和教育版用户。
6/7/2025 8:35:43 AM
清源
Dify工具插件开发和智能体开发全流程实战
前言Dify是一款开源的大语言模型应用开发平台,旨在降低AI应用的开发门槛,帮助开发者和企业快速构建、部署及管理生成式AI应用。 Dify自1.0.0引入全新插件化架构,模型(Models)与工具(Tools)迁移为插件(Plugins),引入 Agent 策略(Agent Strategies)、扩展(Extensions)类型插件和插件集(Bundles)。 通过全新的插件机制,能够增强 AI 应用的感知和执行能力,拓宽AI在软件操作领域的应用能力。
6/6/2025 10:01:25 AM
AI大模型应用开发
AI Agent 产品交互设计:设计模式与案例分析
作者 | 贾思玉、亢江妹 或许你还记得 ChatGPT 问世时的轰动,第一次使用 DeepSeek R1 的兴奋和激动也历历在目。 AI Agent 发展一日千里,今年以来,几乎每个月都有新的 AI Agent 产品发布,现有产品也不断更新换代,让人目不暇接。 本文将从体验设计视角,来看看当下热门的 AI Agent 产品,如 Manus、Flowith、Gemini Deep Research、Cursor、Devin 等,分析 Agent 产品面临的设计挑战,探讨有效的交互设计模式,以及如何打造高效、易用、友好的 Agent 交互体验。
6/6/2025 9:46:57 AM
Thoughtworks洞见
LLM 协作革命:Group Think 如何重塑推理边界
大家好,我是肆〇柒。 今天和大家聊聊 Group Think。 顾名思义,它通过让单个 LLM 模拟多个并行推理智能体,并以 token 级别的细粒度协作,提出了推理协作的新范式。
6/6/2025 8:57:42 AM
肆零柒
大模型公司挖墙脚哪家强?报告:Anthropic人才吸引力是OpenAI的8倍,留存率达80%
大模型公司挖墙脚哪家强,Anthropic才是最大赢家? 不仅顶尖AI人才的留存率达到80%,而且工程师从OpenAI跳槽到Anthropic的可能性是从Anthropic转投OpenAI的8倍。 不止OpenAI,大型科技公司也是Anthropic主要的人才猎场。
6/6/2025 12:33:00 AM
DeepSeek 等模型训练所依赖的合成数据,BARE 提出了新思路
大家好,我是肆〇柒,在AI圈,大型语言模型(LLM)的训练对高质量、多样化数据的需求日益增长。 从去年到现在,一些模型在发布的时候,会有论文或者技术报告,里面多多少少都会提及合成数据,并且在多数情况下,合成数据的效果并不差。 比如,我所看到的报告中,使用了合成数据的模型如下盘点(应该会有遗漏,它并不完整)。
6/4/2025 9:15:16 AM
肆零柒
微软再放LLM量化大招!原生4bit量化,成本暴减,性能几乎0损失
最近,微软亚研院的研究团队开源了原生1bit精度的大模型:BitNet b1.58 2B4T。 还没过几天,原班人马带着第二代BitNet v2来了! 这次性能几乎0损失,但占用内存和计算成本显著降低!
6/3/2025 8:49:00 AM
函数向量对齐技术,让大模型持续学习不“失忆”丨ICLR 2025
LLMs为什么总是灾难性遗忘? 原来是功能激活在搞怪。 最近来自中国科学技术大学、香港城市大学和浙江大学的联合研究团队,通过对多个语言模型、任务序列和评估指标的系统分析,终于破解了LLMs的灾难性遗忘之谜——遗忘行为具有高度的模型依赖性,而导致遗忘发生的本质却是功能激活的变化。
6/3/2025 8:35:00 AM
AI记忆系统首获统一框架!6大操作让大模型拥有人类记忆能力
当AI不再只是“即兴发挥”的对话者,而开始拥有“记忆力”——我们该如何重新定义智能? 来自香港中文大学、爱丁堡大学、香港科技大学与华为爱丁堡研究中心的研究团队联合发布了一项关于AI记忆机制的系统性综述,旨在在大模型时代背景下,重新审视并系统化理解智能体的记忆构建与演化路径。 大语言模型(LLMs)正快速从纯文本生成工具演化为具有长期交互能力的智能体。
6/3/2025 8:32:00 AM
为什么非要做Agent?我用传统方法也能实现啊!
"我硬编码10分钟就能搞定的功能,你用Agent折腾半天还不稳定,图啥? " 技术群里,老王又开始质疑我们的Agent项目了。 作为一个写了15年代码的资深工程师,他的话很有代表性。
6/3/2025 6:39:54 AM
大数据AI智能圈
AI大模型踩过的坑,每一个都价值千万
看着你们公司几十台服务器嗡嗡作响,显卡温度报警声此起彼伏,老板又在催问"大模型什么时候能上线? " 这个熟悉的场景,是不是让你想起了那句话——"理想很丰满,现实很骨感"。 训练一个千亿参数的大模型,好比盖一栋摩天大楼。
6/3/2025 6:30:05 AM
大数据AI智能圈
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
马斯克
AI创作
智能体
论文
英伟达
Anthropic
代码
训练
算法
Stable Diffusion
芯片
蛋白质
开发者
LLM
腾讯
生成式
Claude
苹果
Agent
AI新词
神经网络
AI for Science
3D
机器学习
研究
生成
xAI
人形机器人
AI视频
计算
Sora
GPU
AI设计
百度
华为
工具
大语言模型
搜索
具身智能
场景
RAG
字节跳动
大型语言模型
深度学习
预测
伟达
视觉
Transformer
视频生成
AGI
架构
神器推荐
亚马逊
Copilot
DeepMind
应用
安全