AIGC宇宙 AIGC宇宙

技术

函数向量对齐技术,让大模型持续学习不“失忆”丨ICLR 2025

LLMs为什么总是灾难性遗忘? 原来是功能激活在搞怪。 最近来自中国科学技术大学、香港城市大学和浙江大学的联合研究团队,通过对多个语言模型、任务序列和评估指标的系统分析,终于破解了LLMs的灾难性遗忘之谜——遗忘行为具有高度的模型依赖性,而导致遗忘发生的本质却是功能激活的变化。
6/3/2025 8:35:00 AM

舍弃自回归!国内团队打造纯扩散多模态大模型LLaDA-V,理解任务新SOTA

本文介绍的工作由中国人民大学高瓴人工智能学院李崇轩、文继荣教授团队与蚂蚁集团共同完成。 游泽彬和聂燊是中国人民大学高瓴人工智能学院的博士生,导师为李崇轩副教授。 该研究基于团队前期发布的、首个性能比肩 LLaMA 3 的 8B 扩散大语言模型 LLaDA。
5/27/2025 3:35:02 PM

OpenAI与微软正商讨修改双方合作条款

根据英国《金融时报》的报道,OpenAI 和微软正在商讨修改双方的合作条款,这一调整可能为 ChatGPT 的开发公司打开未来上市的大门,并确保微软能持续获取前沿的人工智能技术。 此次谈判不仅关乎 OpenAI 的商业模式,也涉及到微软在这项技术领域的重要投资。 据知情人士透露,微软正在考虑放弃其在 OpenAI 新营利性业务中的部分股权,以换取在2030年一项重要合同到期后,能够使用 OpenAI 新开发的人工智能模型。
5/12/2025 10:01:12 AM
AI在线

52页PPT,谷歌Gemini预训练负责人首次揭秘!扩展定律最优解

谷歌凭借Gemini 2.5 Pro在激烈的大模型竞争中一举翻盘。 近日,Geimini Flash预训练负责人Vlad Feinberg在普林斯顿大学分享了相关内容。 他深入分析了Gemini预训练的方法、挑战以及方向,如何在模型大小、算力、数据和推理成本间取得平衡。
4/29/2025 9:16:00 AM
新智元

无缝切换,实现多厂家大模型高效对接

1、问题介绍在 AI 技术迅猛发展的今天,越来越多的研发同学面临着众多大模型选型的挑战。 随着业务需求的多样化,大家希望能够逐一对比和探索不同的大模型,以便选择最适合的解决方案。 然而,不同模型的对接方式各异,请求格式、参数解析也各不相同,这给开发者带来了不小的困扰。
3/14/2025 9:02:03 AM
架构精进之路

OpenAI的视频生成模型Sora现已在欧洲上线

OpenAI 该公司宣布,其视频生成模型 Sora 现已正式在欧洲地区上线。 这意味着,包括欧盟、英国、瑞士、挪威、列支敦士登以及冰岛的用户,现在都能享受到这一创新科技带来的便利。 Sora 模型的首次亮相是在2024年2月。
2/28/2025 5:26:00 PM
AI在线

DeepSeek安全:AI网络安全评估与防护策略

一、引言近年来,人工智能技术在全球范围内引发了深刻的科技变革与产业变革,而中国人工智能初创公司 DeepSeek 凭借其低成本、高性能的 AI 模型(如 DeepSeek-R1)迅速崛起,成为全球科技领域的焦点之一。 在当前全球数字化加速推进、网络安全威胁日益复杂的背景下,DeepSeek 技术架构与市场定位不仅为行业带来了新的可能性,同时也引发了广泛的网络安全关切。 本文基于现有的公开资料,从企业资深网络安全专家的视角,系统梳理DeepSeek技术在网络安全领域的潜在贡献与核心风险,并结合中国自主可控的发展战略,提出针对性的应对策略,旨在为相关企业和机构提供全面、深入的参考,以更好地应对人工智能时代的网络安全挑战。
2/10/2025 12:00:00 AM

同样薪资,该去大厂还是投身 DeepSeek?答案惊人!

这几天,deepseek的招聘刷屏了,贼高的薪资,让太多的人着实羡慕。 图片一、大厂与DeepSeek的核心差异1. 职业发展路径大厂的优势:大厂通常拥有明确的职级体系和晋升机制(如阿里的P序列、腾讯的T序列),员工可以清晰看到从初级到专家的成长路径。
2/8/2025 10:33:33 AM
不才陈某

返老还童,OpenAI做到了?首个逆龄AI将登场,人类寿命可延长10年

超级智能要来了? 人类「长生不老」有希望了? 外媒称,OpenAI开发出了首款用于「长寿」的AI模型 ——GPT-4b micro,预计将人类寿命延长10年。
1/20/2025 9:13:00 AM
新智元

文档解析技术指南:从传统Pipeline到端到端大模型

众多文档,如技术手册、历史档案、学术论文和法律文件,往往以扫描件或图片形式存在。 这对检索增强生成(Retrieval-Augmented Generation, RAG)、内容提取以及文档解读等后续处理工作构成了极大的挑战。 文档解析技术应运而生,它能够识别并提取文档中的多种元素,如文字、公式、表格和图片,同时保持它们之间的结构联系。
1/16/2025 10:11:58 AM
追求卓越的

G行人工智能与大模型技术的应用与发展

一、人工智能与大模型技术在银行业的普遍应用1. 客户服务和智能客服客户服务是人工智能应用的核心领域之一。 传统银行客户服务依赖专业的人工客服,虽然能提供较高的情感交互,但因响应时间较长、服务覆盖面有限以及成本较高,难以满足现代客户对高效、便捷服务的需求。
12/31/2024 8:46:28 AM
王涛 刘丁

沃顿商学院教授发文解析o1:能力仍有短板,「人机协同智能」或成AGI最重要难题

o1 preview问世3个月后,满血版的o1 Pro终于在上周以每月200美元的身价正式上线,奥特曼号称其为「当今世界上最智能的模型」。 所以,这个正式的o1 Pro究竟强大到了什么程度? 可以肯定的是,它远远不是一个走到AGI终点的灭霸,但这是scaling law之后的又一个里程碑吗?
12/18/2024 3:30:00 PM
新智元

谷歌逆风翻盘暴击OpenAI,90天王者归来!44页报告押注25年三大技术前沿

逆袭之战开启,谷歌用90天重回巅峰! 短短90天,谷歌就从业内笑柄,逆袭成突破最大、产品最颠覆的科技大公司。 用AI初创创始人Ole Lehmann的话说,「我们正在见证2024年最大的科技转变」。
12/18/2024 1:20:18 PM

AI大模型时代,人才的需求已经变了

什么是 AI 发展的第一驱动力? 最近,全球科技大厂都在用行动告诉我们:人才。 本月初,谷歌 NotebookLM 的核心团队共同宣布离职创业,他们新公司的网站已经进入了「建设中」的状态。
12/17/2024 9:08:00 PM
机器之心

在大模型时代,智能化推荐怎么做呢?

自2022年11月30日OpenAI发布ChatGPT以来,大模型技术掀起了新一轮人工智能浪潮。 ChatGPT在各个领域(如人机对话、文本摘要、内容生成、问题解答、识图、数学计算、代码编写等)取得了比之前算法好得多的成绩,很多方面都超越了人类专家的水平,特别是人机对话具备了一定的共情能力,这让AI领域的工作者和普通大众都相信AGI(Artificial General Intelligence,通用人工智能)时代马上就要来临了。  大模型除了对话能力达到了跟真正互动的水准,更厉害的是当模型参数规模达到一定量(100B ,这里B是billion,十亿的意思)时,会涌现出新的能力,即大模型具备举一反三、任务分解、逻辑推理、解决未知任务的能力,这在之前的机器学习范式中是从没见到过的。
12/13/2024 8:54:42 AM
刘强

OpenAI总裁回归!将更专注重大技术挑战,“结束人生最长假期”

OpenAI联创&总裁Greg Brockman,回来了! 刚刚,他在推特上宣布,自己人生中最长的假期结束了,现在要回来继续建设OpenAI。 据爆料,Brockman周二在内部发布了回归的公告。
11/13/2024 2:00:00 PM
量子位

轻松搭建AI版“谁是卧底”游戏,muAgent框架让知识图谱秒变编排引擎,支持复杂推理+在线协同

全新Agent框架,将知识图谱从知识获取来源直接升级为Agent编排引擎。 蚂蚁集团推出muAgent,兼容现有市面各类Agent框架,同时可实现复杂推理、在线协同、人工交互、知识即用四大核心差异技术功能。 这套框架目前在蚂蚁集团内多个复杂DevOps场景落地验证,同时可通过快速搭建的创新AI文本游戏“谁是卧底”游戏快速感受一下。
11/6/2024 2:46:10 PM

OpenAI 承认正研发 ChatGPT 文本水印,但面临挑战

据《华尔街日报》报道,OpenAI 已经开发出一款能够高精度识别 ChatGPT 生成文本的工具,但迟迟未发布。对此 OpenAI 进行了回应,承认正在研究文本水印技术,但表示这项技术仍存在诸多挑战。图源 Pexels据AI在线了解,通过文本水印,OpenAI 将只专注于检测来自 ChatGPT 的文字,而不是来自其他公司模型的文字。其将通过对 ChatGPT 选择单词的方式进行微小的更改来实现这一点,本质上是在文字中创建一个不可见的水印,以后可以被一个单独的工具检测到。OpenAI 称,文本水印是他们探索的多种解
8/5/2024 7:12:17 AM
远洋