文章列表
北大团队提出全新框架LIFT 将长上下文知识注入模型参数
北京大学张牧涵团队提出了一种全新的框架——Long Input Fine-Tuning (LIFT),通过将长输入文本训练进模型参数中,使任意短上下文窗口模型获得长文本处理能力。 这一方法颠覆了传统的长文本处理思路,不再专注于无限扩充上下文窗口,而是将长文本知识内化到模型参数中,类似于人类将工作记忆转化为长期记忆的过程。 目前大模型处理长文本面临两大主要挑战:传统注意力机制的平方复杂度导致处理长文本时计算和内存开销巨大 模型难以理解散落在长文本各处的长程依赖关系现有的解决方案如RAG和长上下文适配各有局限:RAG依赖准确的检索,容易引入噪声导致幻觉 长上下文适配的推理复杂度高,上下文窗口仍然有限LIFT的技术创新LIFT框架包含三个关键组件:动态高效的长输入训练通过分段的语言建模将长文本切分为有重叠的片段 避免因过长上下文造成的推理复杂度提升和长程依赖丢失 训练复杂度对长文本长度呈线性增长 平衡模型能力的门控记忆适配器设计专门的Gated Memory Adapter架构 动态平衡原始模型的In-Context Learning能力和对长输入的记忆理解 允许模型根据查询自动调节使用多少LIFT记忆的内容辅助任务训练通过预训练LLM基于长文本自动生成问答类辅助任务 补偿模型在切段训练中可能损失的能力 帮助模型学会应用长文本中的信息回答问题实验结果LIFT在多个长上下文基准测试上取得显著提升:LooGLE长依赖问答:Llama38B的正确率从15.44%提升至29.97% LooGLE短依赖问答:Gemma29B的正确率从37.37%提升至50.33% LongBench多项子任务:Llama3通过LIFT在5个子任务中的4个有明显提升消融实验表明,Gated Memory架构相比使用PiSSA微调的原模型,在LooGLE ShortQA数据集上的GPT-4score提升了5.48%。
3/17/2025 3:59:00 PM
AI在线
研究显示 60% 以上 AI 聊天机器人回答错误,新闻可信度遭受挑战
根据哥伦比亚新闻评论的数字新闻中心最新研究流行的 AI 搜索工具在回答问题时超过60% 的概率提供了不正确或误导性的信息。 这一结果令人担忧,因为这些工具不仅削弱了公众对新闻报道的信任,也使出版商面临流量和收入的双重损失。 图源备注:图片由AI生成,图片授权服务商Midjourney研究人员测试了包括 ChatGPT、Perplexity、Gemini 和 Grok 在内的八款生成式 AI 聊天机器人,要求它们识别来自200篇最新新闻文章的摘录。
3/17/2025 2:40:00 PM
AI在线
OpenAI 高管预测:AI 将于2025年底超越人类程序员
在最近的一期播客中,OpenAI 的首席产品官凯文・维尔(Kevin Weil)表示,人工智能有望在性编码基准测试中在今年底之前超越人类程序员。 这一言论是在与 Avalon 首席执行官瓦伦・梅亚(Varun Mayya)和 YouTuber 坦梅・巴特(Tanmay Bhat)进行对话时提出的。 凯文回顾了近年来人工智能的快速发展,强调了 AI 编码模型的显著进步。
3/17/2025 2:36:00 PM
AI在线
小米大模型团队在音频推理领域取得重大突破,登顶国际评测榜
近日,小米大模型团队在音频推理领域的研究中取得了突破性进展,成功应用强化学习算法于多模态音频理解任务,准确率达到了64.5%,这一成就使其在国际权威的 MMAU 音频理解评测中夺得了第一名。 这一成果的背后,离不开团队对 DeepSeek-R1的启发。 MMAU(Massive Multi-Task Audio Understanding and Reasoning)评测集是衡量音频推理能力的重要标准,通过对包含语音、环境声和音乐的多种音频样本进行分析,测试模型在复杂推理任务中的表现。
3/17/2025 2:13:00 PM
AI在线
李开复推出万智企业大模型平台,强调大模型竞争新方向
在中国人工智能领域的不断演进中,李开复创办的 AI 公司 “零一万物” 于2025年3月17日宣布推出其全新的万智企业大模型一站式平台。 该平台旨在为企业提供定制化的 DeepSeek 部署解决方案,助力企业高效应用大模型技术。 万智企业大模型一站式平台预装了多款高性能 GPU,如昇腾等,内置 DeepSeek 全系列模型,灵活支持前沿的 AI 模型架构,满足企业在搜索和数据处理上的需求。
3/17/2025 2:00:00 PM
AI在线
钉钉推出AI客服助理 可自动接入企业官网、公众号等平台
2025年3月17日,钉钉宣布推出一项重磅AI能力——AI客服助理,该功能可自动接入企业官网、公众号等平台,直接服务消费者和企业客户。 这一创新举措一经推出便受到企业客户的广泛欢迎,目前已有包括云深处科技、Rokid(乐奇)、瑞德林、艾为电子、精准学等在内的700多家企业接入使用。 钉钉AI客服助理通过多轮对话能够精准理解用户的真实需求,并有效回复复杂问题,如“产品参数对比”等深度咨询内容。
3/17/2025 1:54:00 PM
AI在线
2025年99%代码AI生成!OpenAI高管宣告没有退路,人类将被全面超越
「2025年底,99%的编码将实现AI自动化」! 图片这是OpenAI首席产品官Kevin Weil在最新一期采访中,向全世界发出的郑重宣告。 他大胆预测,今年是人工智能在编程方面,永远超越人类的一年,我们已经没有退路了。
3/17/2025 1:51:06 PM
新智元
小米大模型团队登顶音频推理 MMAU 榜,受到DeepSeek-R1启发
小米技术官方微博宣布,小米大模型团队在音频推理领域取得了显著进展。 他们在受到 DeepSeek-R1的启发后,率先将强化学习算法应用于多模态音频理解任务。 团队在短短一周内便以64.5% 的 SOTA(State Of The Art)准确率,登顶国际权威的 MMAU 音频理解评测榜,并同步将相关技术开源。
3/17/2025 11:43:00 AM
AI在线
OpenAI重磅剧透:GPT-5“很快推出”,CPO预测年内AI代码自动化将达99%!
近日,OpenAI 首席产品官(CPO)Kevin Weil 在一次备受关注的访谈中透露了多个重磅消息,引发业界广泛关注。 最引人瞩目的是关于备受期待的 GPT-5以及 AI 代码自动化进程的预测。 对于 GPT-5的发布时间,Kevin Weil 虽然没有给出具体日期,但他明确表示:“我不会给你具体时间,但 GPT-5会很快出现。
3/17/2025 11:19:00 AM
AI在线
Deepseek崛起挑战霸主!a16z最新AI应用Top100榜单发布,17家新秀强势入围前50!
风险投资公司 Andreessen Horowitz (a16z) 最新发布的消费者人工智能领域报告揭示了显著的市场动态。 报告追踪了排名前100的消费级 AI 应用,通过 Similarweb 的网络访问数据和 Sensor Tower 的移动应用数据进行排名,每两年更新一次。 最新排名显示,自2024年8月以来,有17家新公司跻身前50名,标志着市场格局的重大变化。
3/17/2025 10:30:00 AM
AI在线
快手可灵AI全面接入DeepSeek-R1,DeepSeek灵感版已上线
近日,快手旗下的可灵AI有了新动作。 作为快手推出的新一代AI创意生产力平台,可灵AI自去年发布后,就不断进行迭代升级。 其模型能力和生成效果一直处于行业较为领先的位置,还推出了众多创作功能和创意玩法。
3/17/2025 10:12:00 AM
AI在线
一次排查 Cursor Bug 的经历
相信很多同学日常编码已经用上了Cursor。 最近,我在用Cursor过程中遇到了「注册的MCP服务不调用」的问题。 经过一顿排查,最终确定是Cursro自身bug导致。
3/17/2025 10:01:07 AM
卡颂
AI创作提速!可灵AI集成DeepSeek,灵感秒变专业级提示词!
据36氪消息,快手旗下新一代AI创意生产力平台可灵AI宣布已全面接入DeepSeek-R1模型。 通过此次集成,用户在使用可灵AI的视频生成、图片生成等功能时,可借助DeepSeek-R1的强大能力辅助生成或优化提示词。 这一创新功能旨在帮助用户轻松将创意灵感转化为专业的提示词,从而打造更高质量的AI创意视频内容。
3/17/2025 8:53:00 AM
AI在线
27个大模型混战电商领域,DeepSeek-R1&V3仍是最强丨首个中文电商问答基准评估结果
全面评估大模型电商领域能力,首个聚焦电商基础概念的可扩展问答基准来了! ChineseEcomQA,来自淘天集团。 此前,大模型常因生成事实性错误信息而受限,而传统基准又难以兼顾电商任务的多样性与领域特殊性。
3/17/2025 8:48:00 AM
量子位
早报速读!2025年最新AI视频产品评测&优秀案例
自 24 年 H2 开始,AI 视频行业以周为单位高速发展,GenLumio 是我从 24 年开始 0-1 规划 - 设计 - 开发的 AI 视频项目,旨在为大家带来每周最新鲜的 AI 视频优秀作品、产品动向。 我计划通过这个系列的文章选取新鲜产品动向、优质作品案例为大家介绍。 网站1期功能介绍多维度分类:目前网站已整理出 20 种类别,包括 动漫、叙事短篇、增加元素、风格参考、主体物替换、首尾帧、对口型等,涵盖 AI 视频技术的主要应用场景。
3/17/2025 1:42:23 AM
Bay的设计奥德赛
十个让DeepSeek变强大的指令模型
以下是10个AI指令万能公式及对比案例,涵盖不同场景下的应用技巧,帮助大家通过结构化指令提升AI输出质量:1. 角色定位法:明确AI的专家身份错误指令: "写一篇产品营销文案。 " (AI可能生成通用模板,缺乏针对性)正确公式:【角色】 【任务】 【场景】案例: "你是一位10年经验的数码产品营销专家,请为新品智能手表撰写一篇小红书文案,重点突出健康监测功能和商务场景适配性。
3/17/2025 12:22:00 AM
数师兄
大厂实战!如何帮用户一小时轻松搭建智能体?
前言. 我们身处 AI 的浪潮中,智能体已在各行各业为大家带来便利,如基金经理可以利用智能体帮自己分析市场趋势、出租屋中介可以让智能体替自己回答咨询问题。 现在,在百度营销平台,广告主也可以搭建属于自己的品牌智能体,让品牌与用户能产生更直接的互动,从而激发品牌潜能,提升品牌影响力。
3/16/2025 6:55:51 AM
团队百度MEUX
DeepSeek AI 爆红引发业界“狂欢”,三千“李鬼”网站号称“49 元本地部署”“198 元永久会员”
国产AI大模型DeepSeek成爆款,却出现大量仿冒App和网站,坑骗消费者钱财、窃取信息,构成商标侵权。律师提醒选官方渠道下载,遇假冒及时举报。 #AI大模型 #DeepSeek #仿冒侵权#
3/15/2025 3:00:27 PM
漾仔