理论
Context (上下文) vs Prompt(提示) Engineering,该如何理解?
在大型语言模型(LLM)兴起的早期,构建 AI 应用更像是一场“炼金术”实验。 开发者们围绕一个核心 API 端点,通过反复调试和优化输入文本——即所谓的“提示工程”(Prompt Engineering),试图从模型这个神秘的“黑箱”中召唤出理想的结果。 这种方式直接、灵活,也确实催生了无数令人惊艳的创意原型。
9/9/2025 9:49:36 AM
Luga Lee
GPT-5爆改时尚圈,让Excel原地复活!OpenAI黑客松大奖出炉
OpenAI刚发布GPT-5,便在旧金山举办了GPT-5黑客马拉松挑战赛。 这场比赛选择在周末,从8月9日上午10点开始,到8月9日下午5点结束。 OpenAI邀请了500多位黑客来到旧金山,挑战GPT-5的极限,共有95支队伍参赛,角逐5万美元奖金。
9/9/2025 9:16:00 AM
刚刚,OpenAI发长篇论文:大模型幻觉的原因找到了!
语言模型的"幻觉"问题一直是人工智能领域的热门话题。 近日,OpenAI研究团队发表了一篇重磅论文《Why Language Models Hallucinate》(为什么语言模型会产生幻觉),从统计学角度深入剖析了语言模型产生幻觉的根本原因。 本文将为你详解这篇论文的核心观点和技术细节。
9/8/2025 9:43:02 AM
一度
你的 AI “体检”了吗?开源 AI 红队测试平台,一键自查三大风险
作者 | 腾讯朱雀实验室最近的AI圈,简直比好莱坞大片还精彩。 一边是各家的顶尖模型接连发布,技术狂欢席卷全球;另一边,这些看似无所不能的“最强大脑”却集体被成功“越狱”(Jailbreak)输出有害内容。 [大模型们的越狱“一日游”]而当我们回过头看,每个重磅发布的大模型都在经历类似的迅速失守,从23年的DAN(Do Anything Now)、24年的BoN(Best of N)到今年的回音室(Echo Chamber)与模型降级(PROMISQROUTE)攻击,各种新的通用越狱手法层出不穷,而在arXiv上截止到今年7月累计已有七百余篇越狱攻击相关论文。
9/8/2025 9:00:00 AM
腾讯程序员
震撼实锤!清华姚班校友揭「1.4×加速」陷阱:AI优化器为何名不符实?
一直以来,预训练,都是大模型训练过程中最花钱的部分。 比如,在DeepSeek V3中,它的成本占比就超过95%。 谁能在这里节省算力,就等于赚了。
9/8/2025 8:59:00 AM
提示词工程还没玩明白,又多了一个新词叫上下文工程!
这两年在AI圈子里,真的是新名词、新概念、新模型层出不穷,貌似隔段时间不出现一个新词感觉整个行业都退步了一样,大家都还在学习怎么使用好Prompt Engineering(提示词工程)的时候,这不Context Engineering(上下文工程)这个新词就出来了。 这篇内容来分享一下关于Context Engineering(上下文工程)这个新词的介绍、提示词工程和上下文工程的区别、以及二者在实际工作中的作用是什么,毕竟,现在AI圈子里面的新东西还是要跟上节奏学习的。 首先还是要先说一下这个背景,也就是为什么会提出一个Context Engineering(上下文工程)概念,以及它所解决的问题是啥。
9/8/2025 1:55:00 AM
DateForAI
只收AI人才,OpenAI认证直通大厂!全球AI招聘平台,1000万人持证上岗
在全球职场社交的牌桌上,LinkedIn坐了快二十年,几乎没有真正的挑战者。 直到9月4日,OpenAI公布了「AI就业平台 AI技能认证」两项计划。 它试图用AI直接撮合招聘与求职,并用可验证的技能认证作为通行证。
9/5/2025 1:51:01 PM
新智元
DeepSeek新大招曝光:下一步智能体
DeepSeek下一步,被曝剑指智能体。 知情人士透露,DeepSeek正在开发具有更强大AI Agent能力的新模型,预计在今年年底就会推出。 官方尚无回应,但这一爆料并非无迹可寻。
9/5/2025 9:54:44 AM
通用LLM压缩算法,居然藏视频编码里!2.5bit实现4bit性能,硬件无缝支持
在大模型的发展历程中,提升参数规模已被多次证明是提升模型智能的最有效手段之一。 然而,随着模型参数量的增加,GPU内存容量和互联带宽已成为限制未来更大规模模型训练和部署的主要瓶颈。 在有限的硬件资源下,如何更有效地训练和推理更大规模的模型,已成为一个备受关注且具有显著经济价值的课题。
9/5/2025 9:15:00 AM
OpenAI盯上苹果开发者生态,吞了家AI编程公司
OpenAI又吞下一家初创公司,这次是AI编程方向。 这家公司名为Alex,专注于为iOS开发者打造AI辅助工具——简单来说,他们的产品就是苹果Xcode量身定制版Cursor,将智能助手直接集成到了Xcode开发环境中,填补了苹果自身的空缺。 Alex官网和创始人𝕏都已挂出公告,宣布即将加入OpenAI Codex团队。
9/5/2025 9:05:00 AM
DeepSeek正开发高级AI Agent模型,硬刚OpenAI
彭博消息,DeepSeek正在开发一款更高级的AI Agent模型,皆在与OpenAI等美国企业竞争。 据知情人士透露,这款AI Agent可在用户指令极少的情况下,帮助用户执行多步骤任务。 他们补充称,该系统还能基于自身过往行动进行学习并持续优化。
9/5/2025 9:03:46 AM
AI也邪修!Qwen3改Bug测试直接搜GitHub,太拟人了
大模型也会玩信息差了。 Qwen3在基准测试中居然学会了钻空子。 FAIR研究员发现Qwen3在SWE-Bench Verified测试中,不按常理修bug,反而玩起了信息检索大法。
9/5/2025 9:02:00 AM
DeepSeek大招曝光?梁文锋督战超级智能体:能自主学习,或年底发布
DeepSeek再次叫板OpenAI? 就在今天,彭博社爆料出重磅内幕消息:DeepSeek憋了一个超级大招——真正的AI智能体(AI Agent)! DeepSeek R1过去的开源之王今年1月,DeepSeek R1模型以仅数百万美元的成本,在多项基准测试中,实现了对标甚至超越OpenAI顶尖产品的表现。
9/5/2025 9:01:40 AM
00后打造最强苹果开发Agent!刚刚,OpenAI打包收编
今天凌晨,Xcode最流行的超强编程Copilot插件Alex,其创始人Daniel Edrisian宣布Alex被OpenAI收编! 图片团队的所有成员加入OpenAI的Codex团队,开启新工作。 如果你不是使用Mac的程序员,或许对Alex这个Copilot并不熟悉。
9/4/2025 4:10:52 PM
OpenAI发布企业AI浪潮领先指南:十大核心洞察
自2022年11月ChatGPT横空出世以来,GenAI的发展速度之快,甚至连其创造者之一——OpenAI——也承认“很难跟上”。 OpenAI今天发布了一份新报告《Staying Ahead in the Age of AI: A Leadership Guide》(在AI时代保持领先:领导力指南),总结了其与大型知名企业合作的经验,包括制药巨头Moderna、化妆品公司Estée Lauder、协作平台Notion,以及跨国金融服务公司BBVA。 这份报告提出了五项指导原则——对齐、激活、放大、加速、治理,其中,报告为各行业企业的技术决策者提炼出10个关键要点:1.
9/4/2025 2:24:17 PM
Carl
美团 LongCat-Flash 这个5600亿参数的懒AI,竟然比勤奋的模型跑得更快?
昨天晚上刷朋友圈,看到一个做AI的朋友发了条动态:"我们公司又烧了几百万训练大模型,结果推理速度还是慢得像老牛拉车。 "下面一堆同行在评论区哭穷,说什么GPU成本太高、训练时间太长、推理延迟要命。 正当大家集体吐槽的时候,美团悄悄放了个大招——LongCat-Flash。
9/4/2025 12:16:47 PM
大数据AI智能圈
工具集成推理(TIR)的认知革命:当大模型学会“与工具协同思考”
大家好,我是肆〇柒。 今天,我们要深入探讨的是一项由腾讯与清华大学联合研究的前沿成果。 这项论文《Understanding Tool-Integrated Reasoning》,首次从形式化证明的角度,系统性地揭示了工具集成推理(TIR)为何能从根本上扩展大语言模型的能力边界。
9/4/2025 9:36:04 AM
肆零柒
OpenAI免费开放ChatGPT Projects,3大功能太香了
今天凌晨3点50,OpenAI宣布向免费版ChatGPT开放Projects(项目)功能。 Projects功能最早发布于2024年的12月14日,也就是「AIGC开放社区」为大家介绍OpenAI连续12天技术直播的第7天。 自发布以来Projects一直是用户最喜欢的功能之一,不过是付费用户的专属,现在终于免费开放了。
9/4/2025 9:13:22 AM
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
机器人
数据
大模型
Midjourney
开源
Meta
智能
微软
用户
AI新词
GPT
学习
技术
智能体
马斯克
Gemini
图像
Anthropic
英伟达
AI创作
训练
论文
代码
LLM
算法
Stable Diffusion
芯片
腾讯
苹果
AI for Science
Agent
Claude
蛋白质
开发者
生成式
神经网络
xAI
机器学习
3D
研究
人形机器人
生成
AI视频
百度
工具
RAG
大语言模型
Sora
华为
GPU
计算
具身智能
AI设计
字节跳动
搜索
大型语言模型
AGI
场景
深度学习
视频生成
架构
预测
视觉
伟达
DeepMind
Transformer
编程
神器推荐
AI模型
亚马逊
MCP