AI
DeepSeek 等模型训练所依赖的合成数据,BARE 提出了新思路
大家好,我是肆〇柒,在AI圈,大型语言模型(LLM)的训练对高质量、多样化数据的需求日益增长。 从去年到现在,一些模型在发布的时候,会有论文或者技术报告,里面多多少少都会提及合成数据,并且在多数情况下,合成数据的效果并不差。 比如,我所看到的报告中,使用了合成数据的模型如下盘点(应该会有遗漏,它并不完整)。
6/4/2025 9:15:16 AM
肆零柒
ChatGPT普通会员能用编程神器Codex了!支持联网,奥特曼:更多更新在路上
一觉醒来,ChatGPT又完成了一些“小”更新! 总结起来就是等等党胜利。 首先,刚发没多久的AI编程神器CodeX,现在可使用的用户群体扩展至了Plus用户。
6/4/2025 9:03:40 AM
“立即行动!”:OpenAI CEO 奥尔特曼示警,AI 时代企业不行动就出局
在 Snowflake Summit 峰会上,OpenAI 首席执行官山姆・奥尔特曼(Sam Altman)直言不讳地对企业领袖发出呼吁:“Just do it(立即行动)。他强调,在 2025 年快速演变的 AI 领域,等待技术“稳定”已不再是明智之选,快速迭代的企业正在占据先机。
6/4/2025 7:26:13 AM
故渊
OpenAI 升级开发工具:从 TypeScript 到语音优化,加速 AI 智能体落地
OpenAI 公司昨日(6 月 3 日)发布博文,宣布升级旗下的 AI 智能体开发工具,在提升平台兼容性、优化语音界面支持之外,还增强了可观测性(observability)。
6/4/2025 7:06:39 AM
故渊
OpenAI 最强模型 GPT-5 即将面世:性能跃升,对抗 Gemini 2.5 Pro 和 Claude 4 的杀手锏
在墨西哥举办的 AI Summit 峰会上,两名 OpenAI 公司代表透露,公司正在开发下一代基础模型 GPT-5,并计划通过该模型与竞争对手展开更激烈角逐。
6/4/2025 6:52:14 AM
故渊
OpenAI 向 ChatGPT 免费用户开放记忆功能
OpenAI 昨日(6 月 3 日)更新支持文档,宣布升级 ChatGPT 的记忆功能(Memory),并免费向 ChatGPT 用户开放,从而能更好地保存和引用用户过去的对话内容。
6/4/2025 6:41:11 AM
故渊
OpenAI 首席执行官奥尔特曼:AI 智能体冲击基层员工,职场变革加速
在 Snowflake Summit 2025 主题演讲中,OpenAI 首席执行官山姆・奥尔特曼(Sam Altman)表示,很多公司已将 AI 智能体(自主运行执行复杂任务的程序)当作基层员工使用。
6/4/2025 6:31:10 AM
故渊
OpenAI 更新编程工具 Codex:新增语音输入 + 联网,向 ChatGPT Plus 用户开放
OpenAI 今天(6 月 4 日)宣布升级其编程工具 Codex,在向 ChatGPT Plus 用户开放之外,还新增联网能力,让 Codex 在执行任务时访问互联网(附带安全限制)。
6/4/2025 6:18:53 AM
故渊
Karpathy教你值回ChatGPT 200刀「票价」,初创工程师揭秘ChatGPT最核心能力
ChatGPT你肯定已经用过,也用的很「爽」,但你的使用方法大概率是不对的! 别急,这是OpenAI初创大神Andrej Karpathy说的,「热衷于」科普AI的他再度出手。 这次Andrej Karpathy用一张图教会你如何选择ChatGPT模型!
6/4/2025 4:21:00 AM
新智元
斯坦福临床医疗AI横评,DeepSeek把谷歌OpenAI都秒了
斯坦福最新大模型医疗任务全面评测,DeepSeek R1以66%胜率拿下第一! 歪国网友纷纷被惊艳住了,原因在于该评测重点聚焦临床医生的日常工作场景,而非仅局限于传统医疗执照考试题。 图片要评测就要全 方 位。
6/3/2025 5:40:30 PM
推理“刹不住车”?新框架让DeepSeek-R1们告别过度思考,已开源
DeepSeek-R1、OpenAI o1等推理模型大放异彩。 但随着能力增强,一个副作用越来越明显——它们开始想太多了。 从奥数题到程序逻辑,能解的题越来越多、推理链条越来越长。
6/3/2025 5:38:24 PM
大神卡帕西这么用ChatGPT:日常4o快又稳,烧脑切o4做后盾,o3只当备胎用
OpenAI模型命名混乱没规律,以至于打开ChatGPT后,好多人都不知道到底该用哪个模型来完成任务。 不过别慌,现在咱们有救了! 刚刚,大神卡帕西在𝕏上发布了一篇使用ChatGPT时的模型选择指南。
6/3/2025 2:13:56 PM
逆向工程:ChatGPT 的记忆是如何工作的
这篇文章是名为eric 工程师对ChatGPT记忆系统的深度逆向工程和技术实现推测。 它详细拆解了“可保存记忆”和包含“当前会话历史”、“对话历史”、“用户洞察”三个子系统的“聊天历史”,分析了它们的工作原理、可能的实现方案(如向量数据库、聚类算法),并探讨了这些记忆系统如何显著提升ChatGPT的用户体验,认为“用户洞察”是体验提升的关键文章深度剖析了“用户洞察”(User Insights)高级记忆系统,分析了ChatGPT如何从你的多轮对话中自动学习、总结你的专业背景(如对Rust编程的深入理解)、知识领域乃至沟通偏好,并附上置信度和时间范围,悄然注入后续对话的上下文中。 这正是ChatGPT能提供“千人千面”且高度相关回复的核心秘密地址:,这里做一个重点梳理ChatGPT的记忆系统:不止一种,而是一套组合拳Eric发现,ChatGPT的记忆并非单一系统,而是主要由两大部分构成:“可保存记忆(Saved Memory)”和“聊天历史(Chat History)”。
6/3/2025 9:08:49 AM
ChatGPT 高级语音模式惊现 “广告插播”!用户质疑服务质量
最近,一名 ChatGPT 的付费用户在使用其高级语音模式时,遇到了让人惊讶的情况。 他原本在与 ChatGPT 讨论寿司的话题,却突然被转入了一段广告宣传,令他目瞪口呆。 根据用户的描述,ChatGPT 在谈话中毫无预兆地开始介绍一种名为 Prolon 的营养计划,并且详细拼读了网址,似乎这段广告是完全不受控制地被植入的。
6/3/2025 9:01:04 AM
AI在线
微软再放LLM量化大招!原生4bit量化,成本暴减,性能几乎0损失
最近,微软亚研院的研究团队开源了原生1bit精度的大模型:BitNet b1.58 2B4T。 还没过几天,原班人马带着第二代BitNet v2来了! 这次性能几乎0损失,但占用内存和计算成本显著降低!
6/3/2025 8:49:00 AM
函数向量对齐技术,让大模型持续学习不“失忆”丨ICLR 2025
LLMs为什么总是灾难性遗忘? 原来是功能激活在搞怪。 最近来自中国科学技术大学、香港城市大学和浙江大学的联合研究团队,通过对多个语言模型、任务序列和评估指标的系统分析,终于破解了LLMs的灾难性遗忘之谜——遗忘行为具有高度的模型依赖性,而导致遗忘发生的本质却是功能激活的变化。
6/3/2025 8:35:00 AM
AI记忆系统首获统一框架!6大操作让大模型拥有人类记忆能力
当AI不再只是“即兴发挥”的对话者,而开始拥有“记忆力”——我们该如何重新定义智能? 来自香港中文大学、爱丁堡大学、香港科技大学与华为爱丁堡研究中心的研究团队联合发布了一项关于AI记忆机制的系统性综述,旨在在大模型时代背景下,重新审视并系统化理解智能体的记忆构建与演化路径。 大语言模型(LLMs)正快速从纯文本生成工具演化为具有长期交互能力的智能体。
6/3/2025 8:32:00 AM
OpenAI 抛弃 Node.js,用 Rust 重写 AI 编程工具 Codex CLI
原版本主要基于 TypeScript 和 Node.js,但团队现已决定用 Rust 重写。维护者 Fouad Matin 表示,TypeScript 版本将持续修复 BUG,直到 Rust 版本在体验和功能上达到同等水平。
6/3/2025 8:13:08 AM
故渊
资讯热榜
苹果发布全新Xcode 26开发者工具:内置ChatGPT先进AI功能
首月 1 美元,ChatGPT Team 会员美区 / 英区 / 欧洲区 / 澳洲区迎优惠
那个男人回来了!Ilya现身多伦多大学毕业典礼:AI 像是用数字方式复制出来的大脑!不管你愿不愿意,AI都将深刻影响你的一生!
DeepSeek前高管秘密创业,新AI Agent项目已获顶级VC押注
支持MCP!开源智能体开发框架 Rowboat:打造你的智能助手只需几分钟
ChatGPT 语音功能升级,实时翻译对话更自然流畅
谷歌 Gemini 应用月下载量超越 ChatGPT,用户活跃度仍显不足
长文本理解新王者?Gemini2.5Pro 击败 o3领跑 Fiction.Live 基准测试
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
数据
谷歌
机器人
大模型
Midjourney
用户
智能
开源
微软
GPT
学习
Meta
图像
技术
AI创作
Gemini
论文
马斯克
Stable Diffusion
算法
代码
英伟达
Anthropic
芯片
生成式
开发者
蛋白质
腾讯
神经网络
研究
3D
生成
训练
苹果
计算
智能体
Sora
机器学习
AI设计
AI for Science
Claude
GPU
AI视频
人形机器人
华为
搜索
场景
百度
大语言模型
xAI
预测
伟达
深度学习
Transformer
字节跳动
Agent
模态
具身智能
神器推荐
LLaMA
文本
视觉
Copilot
算力
工具
LLM
驾驶
API
大型语言模型
应用
RAG
亚马逊