文章列表

分类

标签

NUS 推出 OmniConsistency：低成本实现图像风格化一致性，挑战 GPT-4o！

近日，新加坡国立大学（NUS）团队发布了一个名为 “OmniConsistency” 的创新项目，旨在以极低的成本复现 OpenAI 的 GPT-4o 模型在图像风格化上的一致性。这项技术不仅解决了当前开源社区在图像风格化和一致性之间的矛盾，还为广大开发者提供了可行的解决方案。近年来，图像风格化的技术不断发展，但在实际应用中，风格与内容一致性之间的平衡一直是个难题。

6/3/2025 10:01:04 AM

AI在线

犹他州律师因引用ChatGPT生成虚假案例遭法庭处罚，AI 应用引发争议

近日，美国犹他州一名律师理查德・贝德纳因在法庭文件中引用由 ChatGPT 生成的虚假案例而遭到法院的制裁。据《卫报》报道，这起事件引发了对人工智能在法律领域应用的广泛讨论。贝德纳与同事道格拉斯・杜尔巴诺共同提交了一份上诉申请，但在审查过程中，发现文中引用了多个不存在的法律判例。

6/3/2025 10:01:04 AM

AI在线

逆向工程：ChatGPT 的记忆是如何工作的

这篇文章是名为eric 工程师对ChatGPT记忆系统的深度逆向工程和技术实现推测。它详细拆解了“可保存记忆”和包含“当前会话历史”、“对话历史”、“用户洞察”三个子系统的“聊天历史”，分析了它们的工作原理、可能的实现方案（如向量数据库、聚类算法），并探讨了这些记忆系统如何显著提升ChatGPT的用户体验，认为“用户洞察”是体验提升的关键文章深度剖析了“用户洞察”（User Insights）高级记忆系统，分析了ChatGPT如何从你的多轮对话中自动学习、总结你的专业背景（如对Rust编程的深入理解）、知识领域乃至沟通偏好，并附上置信度和时间范围，悄然注入后续对话的上下文中。这正是ChatGPT能提供“千人千面”且高度相关回复的核心秘密地址：，这里做一个重点梳理ChatGPT的记忆系统：不止一种，而是一套组合拳Eric发现，ChatGPT的记忆并非单一系统，而是主要由两大部分构成：“可保存记忆（Saved Memory）”和“聊天历史（Chat History）”。

6/3/2025 9:08:49 AM

ChatGPT 高级语音模式惊现 “广告插播”！用户质疑服务质量

最近，一名 ChatGPT 的付费用户在使用其高级语音模式时，遇到了让人惊讶的情况。他原本在与 ChatGPT 讨论寿司的话题，却突然被转入了一段广告宣传，令他目瞪口呆。根据用户的描述，ChatGPT 在谈话中毫无预兆地开始介绍一种名为 Prolon 的营养计划，并且详细拼读了网址，似乎这段广告是完全不受控制地被植入的。

6/3/2025 9:01:04 AM

AI在线

微软推出 Bing Video Creator，免费助力用户轻松创作 AI 视频

最近，微软宣布推出一款新工具 ——Bing Video Creator。这款工具是基于 OpenAI 的 Sora 技术，让用户能够通过简单的文字提示轻松创建短视频。与两年前发布的必应图像创建器相似，Bing Video Creator 将 AI 视频生成的功能带给了普通用户。

6/3/2025 9:01:04 AM

AI在线

OpenAI 计划将 ChatGPT 打造成超级助手，直击苹果 Siri 市场

根据近期曝光的 OpenAI 战略文件，该公司计划在2025年上半年将 ChatGPT 打造成一款 “超级助手”，以挑战苹果的 Siri 市场地位。这份文件通过美国司法部对谷歌的反垄断案件被解密，透露了 OpenAI 对于 ChatGPT 未来发展的宏伟蓝图。文件中指出，OpenAI 希望 ChatGPT 成为一个具备 T 型技能的智能助手。

6/3/2025 9:01:04 AM

AI在线

微软再放LLM量化大招！原生4bit量化，成本暴减，性能几乎0损失

最近，微软亚研院的研究团队开源了原生1bit精度的大模型：BitNet b1.58 2B4T。还没过几天，原班人马带着第二代BitNet v2来了！这次性能几乎0损失，但占用内存和计算成本显著降低！

6/3/2025 8:49:00 AM

函数向量对齐技术，让大模型持续学习不“失忆”丨ICLR 2025

LLMs为什么总是灾难性遗忘？原来是功能激活在搞怪。最近来自中国科学技术大学、香港城市大学和浙江大学的联合研究团队，通过对多个语言模型、任务序列和评估指标的系统分析，终于破解了LLMs的灾难性遗忘之谜——遗忘行为具有高度的模型依赖性，而导致遗忘发生的本质却是功能激活的变化。

6/3/2025 8:35:00 AM

AI记忆系统首获统一框架！6大操作让大模型拥有人类记忆能力

当AI不再只是“即兴发挥”的对话者，而开始拥有“记忆力”——我们该如何重新定义智能？来自香港中文大学、爱丁堡大学、香港科技大学与华为爱丁堡研究中心的研究团队联合发布了一项关于AI记忆机制的系统性综述，旨在在大模型时代背景下，重新审视并系统化理解智能体的记忆构建与演化路径。大语言模型（LLMs）正快速从纯文本生成工具演化为具有长期交互能力的智能体。

6/3/2025 8:32:00 AM

o3崛起，但推理模型离「撞墙」只剩一年？

最多一年，推理模型就会撞上训练算力的「天花板」。 OpenAI的o3这样的推理模型，诞生还不到一年，能力已经突飞猛进。 OpenAI的研究人员非常乐观地认为，这种趋势会持续下去。

6/3/2025 8:26:00 AM

零基础也能轻松上手！3款大厂出品的AI编程工具深度测评

生成式 AI 的不断发展，正在让设计与开发界限逐渐模糊。今天，UI/UX 设计师的角色正在向「全链路」延伸。能否快速验证设计落地的可行性、与开发者高效协作，甚至自主实现简单的前端逻辑，已成为衡量设计师竞争力的新维度。

6/3/2025 8:20:30 AM

Infinite AI

OpenAI 抛弃 Node.js，用 Rust 重写 AI 编程工具 Codex CLI

原版本主要基于 TypeScript 和 Node.js，但团队现已决定用 Rust 重写。维护者 Fouad Matin 表示，TypeScript 版本将持续修复 BUG，直到 Rust 版本在体验和功能上达到同等水平。

6/3/2025 8:13:08 AM

故渊

OpenAI 内部文件曝光：欲将 ChatGPT 打造成超级助手，挑战苹果 Siri 市场地位

OpenAI战略文件曝光，计划将ChatGPT打造成“超级助手”，挑战苹果Siri。文件显示，ChatGPT将具备广泛基础技能和深度专业能力，目标是成为用户随时可用的智能助手。#ChatGPT挑战Siri# #OpenAI战略#

6/3/2025 7:55:43 AM

远洋

微软必应推出 Bing 视频创作器，首次免费开放 OpenAI Sora 模型视频生成能力

微软必应推出基于OpenAI Sora模型的视频创作器，用户可通过文本提示免费生成视频。目前仅支持移动端，生成速度较慢，每次最多可生成3段5秒视频。未来将支持横屏视频生成。#AI视频生成# #微软必应#

6/3/2025 7:24:43 AM

远洋

为什么非要做Agent？我用传统方法也能实现啊！

"我硬编码10分钟就能搞定的功能，你用Agent折腾半天还不稳定，图啥？ " 技术群里，老王又开始质疑我们的Agent项目了。作为一个写了15年代码的资深工程师，他的话很有代表性。

6/3/2025 6:39:54 AM

大数据AI智能圈

AI大模型踩过的坑，每一个都价值千万

看着你们公司几十台服务器嗡嗡作响，显卡温度报警声此起彼伏，老板又在催问"大模型什么时候能上线？ " 这个熟悉的场景，是不是让你想起了那句话——"理想很丰满，现实很骨感"。训练一个千亿参数的大模型，好比盖一栋摩天大楼。

6/3/2025 6:30:05 AM

大数据AI智能圈

基于Gemini与Qdrant构建生产级RAG管道：设计指南与代码实践

一、RAG技术的核心价值与应用场景在人工智能领域，检索增强生成（Retrieval-Augmented Generation, RAG）正成为解决大语言模型（LLM）知识更新滞后、生成内容不可追溯等问题的关键技术。传统的微调（Fine-Tuning）方法将知识固化在模型参数中，难以应对动态领域的快速变化；而RAG通过将检索与生成解耦，实现了知识的实时更新与可追溯性，尤其适用于政策频繁变动、对准确性要求极高的场景，如医疗、法律和航空管理。本文以构建机场智能助理为例，结合Google的Gemini多模态模型与Qdrant向量数据库，详细阐述如何设计并实现一个高可靠、可扩展的生产级RAG管道。

6/3/2025 2:55:00 AM

大模型之路

阿里发布 QwenLong-L1 超长文本杀器！已开源、支持 120k 长上下文、具备“翻书回溯”能力

业界普遍认为AI上下文越长越好，但这存在一个核心矛盾：模型能“吞下”海量信息，却难以真正“消化”。面对长文，它们会忘记要点、无法深入推理，这已成为一大瓶颈。例如，AI 能记住第1页的内容，同时理解第100页的观点，并将两者联系起来进行推理吗？

6/3/2025 12:00:09 AM

资讯热榜

手把手教程！不写一行代码，开发鸿蒙应用，赚1万收入！中国企业大模型市场爆发:半年调用量暴增363%，阿里通义居首位美团首个开源大模型正式发布！LongCat-Flash-Chat能否撼动AI格局？ Anthropic 融资 130 亿美元，估值飙升至 1830 亿美元对话顺丰科技网络安全总监梁博：大模型浪潮下物流网络安全的守与破中国AI三巨头入选《时代》周刊2025年度百强榜单 23岁小哥被OpenAI开除，成立对冲基金收益爆表，165页论文传遍硅谷入局AI4S？CPO宣布「OpenAI for Science」计划：打造下一代科学工具

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek AI绘画谷歌机器人数据大模型 Midjourney 开源智能 Meta 用户微软 GPT 学习技术图像 Gemini 马斯克智能体 AI创作 Anthropic 英伟达 AI新词论文代码训练算法 LLM Stable Diffusion 芯片蛋白质开发者腾讯 Claude 苹果 Agent 生成式 AI for Science 神经网络 3D 机器学习研究 xAI 生成人形机器人 AI视频计算百度 Sora GPU 华为工具 RAG AI设计大语言模型搜索字节跳动具身智能大型语言模型场景深度学习预测视频生成伟达视觉 AGI Transformer 架构神器推荐亚马逊 Copilot 特斯拉 DeepMind 应用

文章列表

NUS 推出 OmniConsistency：低成本实现图像风格化一致性，挑战 GPT-4o！

犹他州律师因引用ChatGPT生成虚假案例遭法庭处罚，AI 应用引发争议

逆向工程：ChatGPT 的记忆是如何工作的

ChatGPT 高级语音模式惊现 “广告插播”！用户质疑服务质量

​微软推出 Bing Video Creator，免费助力用户轻松创作 AI 视频

OpenAI 计划将 ChatGPT 打造成超级助手，直击苹果 Siri 市场

微软再放LLM量化大招！原生4bit量化，成本暴减，性能几乎0损失

函数向量对齐技术，让大模型持续学习不“失忆”丨ICLR 2025

AI记忆系统首获统一框架！6大操作让大模型拥有人类记忆能力

o3崛起，但推理模型离「撞墙」只剩一年？

零基础也能轻松上手！3款大厂出品的AI编程工具深度测评

OpenAI 抛弃 Node.js，用 Rust 重写 AI 编程工具 Codex CLI

OpenAI 内部文件曝光：欲将 ChatGPT 打造成超级助手，挑战苹果 Siri 市场地位

微软必应推出 Bing 视频创作器，首次免费开放 OpenAI Sora 模型视频生成能力

为什么非要做Agent？我用传统方法也能实现啊！

AI大模型踩过的坑，每一个都价值千万

基于Gemini与Qdrant构建生产级RAG管道：设计指南与代码实践

阿里发布 QwenLong-L1 超长文本杀器！已开源、支持 120k 长上下文、具备“翻书回溯”能力

微软推出 Bing Video Creator，免费助力用户轻松创作 AI 视频