理论
硬核拆解!从GPT-2到gpt-oss,揭秘大模型进化关键密码
8月5日,在GPT-5发布前两天,OpenAI推出了它的两款开源权重大语言模型:gpt-oss-120b、gpt-oss-20b。 这是自2019年GPT-2,近六年来OpenAI首次发布开放权重的模型。 得益于巧妙的优化技术,这些模型甚至可以在本地设备上运行。
8/18/2025 9:15:00 AM
大模型给自己当裁判并不靠谱!上海交通大学新研究揭示LLM-as-a-judge机制缺陷
大语言模型(LLM)正从工具进化为“裁判”(LLM-as-a-judge),开始大规模地评判由AI自己生成的内容。 这种高效的评估范式,其可靠性与人类判断的一致性,却很少被深入验证。 一个最基础、却也最关键的问题是:在评判一个模型是否“入戏”之前,AI裁判能准确识别出对话中到底是谁在说话吗?
8/18/2025 9:00:00 AM
谷歌最新「0.27B」Gemma 3开源!身板小却猛如虎,开发者直呼救命稻草
大块头不等于大智慧。 这在生成式AI领域,已逐渐成为共识。 Gemma 3系列的成功就是一个很好的例证。
8/18/2025 8:57:00 AM
破天荒!OpenAI、Cursor多位开发大牛联手曝出GPT5提示词指南!晒官方系统提示词优化秘籍,最大化编程性能,工作流更可控
编辑 | 云昭上周,GPT-5 发布以后,不少网友对这个备受期待的新版本表示无力吐槽。 OpenAI 老板 Altman 在直播间宣称,GPT-5 在自主任务执行能力、编程、综合智能以及可控性方面都实现了显著飞跃。 然而,用户实际用起来却是:“降智”、“Token很快用完”的声讨一片。
8/15/2025 3:02:46 PM
云昭
OpenAI华人露头就被小扎挖!95后北大校友1个月前上直播,今天已是Meta人
又来了又来了,OpenAI华人工程师,果然露脸就被小扎挖(doge)。 这一次,主角是95后北大校友孙之清,上个月刚刚参与了ChatGPT Agent的发布直播。 当时就有不少网友调侃:发布会出镜就是在给Meta提供挖角名单。
8/15/2025 12:27:27 PM
OpenAI波兰双雄:GPT不是偶然!再忆奥特曼被逐当天实况
OpenAI早期,据说午餐时大家太紧张,以至于不敢说话,现在的氛围轻松许多。 甚至OpenAI早期有个「波兰帮」,比如联合创始人Wojciech Zaremba(下图左),后来在编程竞赛击败ChatGPT的信息学奥赛金牌选手Przemysław Debiak(下图右)。 图片还有两位黄金级搭档Jakub Pachocki和Szymon Sidor:现首席科学家Jakub Pachocki,奥特曼称赞为「我们这一代最杰出的头脑之一」;OpenAI技术Fellow、前者的高中同学Szymon Sidor。
8/15/2025 11:54:04 AM
新智元
OpenAI回归开源:gpt-oss-120b和gpt-oss-20b完整指南
译者 | 陈峻审校 | 重楼本文将向你介绍OpenAI新发布的两个开源模型--gpt-oss-120b和gpt-oss-20b,它们的特点,以及在何种场景下该使用哪个模型。 近期,OpenAI发布了两个开源的大语言模型(LLM)--gpt-oss-120b和gpt-oss-20b。 它们是自GPT-2以来,由OpenAI第一个公开许可的LLM。
8/15/2025 8:17:41 AM
陈峻
被曝蒸馏DeepSeek还造假!欧版OpenAI塌房了
离职掀桌! Mistral被曝“蒸馏”DeepSeek。 网友在推特上爆料,一位Mistral离职女员工群发邮件,直指公司多项黑幕。
8/14/2025 6:22:29 PM
ChatGPT会让大脑退化?OpenAI高管用它救下自己「读写障碍」的女儿
ChatGPT会导致大脑退化吗? 它只是一个作弊工具吗? 加入OpenAI之前,Leah Belsky已经在教育领域工作了15年,从世界银行到Coursera,专注于「让教育惠及全球」这一使命。
8/14/2025 6:15:33 PM
OpenAI们都错了!AI教父辛顿再发警告:控制AI是妄想!必须让AI成为“母亲”,学会主动关心人类!李飞飞当场反驳:构想不对!
编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)人类试图控制AI的方式犯了本质错误! 昨日,“AI教父”辛顿(Geoffrey Hinton)在Ai4 行业大会上的发言再次掀起热议。 这位曾警告“AI消灭人类的概率在10%到20%之间”的人工智能先驱,这次把矛头直接对准科技巨头——他质疑,那些试图让人类在所谓“顺从”的AI面前维持“主导地位”的做法,根本行不通。
8/14/2025 3:42:55 PM
伊风
Agent 产品如何定价?我们花的钱,究竟值不值?
一方面,我们对Agent的期望是成为一个可靠、高效、且不知疲倦的伙伴;另一方面,现实体验却常常被一些“意外”打断:资源瓶颈的窘境:在执行关键任务的冲刺阶段,系统突然弹出“积分/点数已耗尽”的提示,如同汽车在距离目的地一公里处耗尽燃油,进程戛然而止。 性能波动的无奈:用户时常面临算力“堵车”的困境,Agent的响应速度时快时慢,尤其在服务高峰期,其表现更像一个“兼职员工”,而非全天候的专业助理。 DeepSeek等前沿应用在发布初期因用户激增而导致的服务器高负载现象,便是这一挑战的缩影。
8/14/2025 11:13:59 AM
DataFun
AIOps系列 | 开发 K8s GPT 故障诊断工具
前面我们介绍了 《开发 K8s Chat 命令行工具》,实现了通过和 Kubernetes 进行交互的方式进行运维,虽然文章中所描述的功能比较简单,但是可以以此进行扩展,丰富功能。 那本章,我们将在 《开发 K8s Chat 命令行工具》的基础之上,增加 Kubernetes 故障诊断工具,其主要功能点是:获取集群的 event 时间,特别关注 warning 级别事件然后进入对应的 pod 获取日志大模型结合事件和日志进行分析,得出解决问题的建议当然,这里也只是起到一个抛砖引玉的作用,提供简单的思路,可以自行扩展。 开发过程(1)首先使用 cobra-cli 新增一个 analyze 命令复制(2)然后在 analyze 下面添加一个子命令 event,专门用于分析事件复制(3)设计一个方法 getPodEventsAndLogs 用于获取 K8s 的事件和日志复制我们使用一个 map[string][]string 来保存 pod 的事件和日志信息,然后通过 client-go 获取 warning 级别的事件,最后过滤需要的 pod 事件以及 pod 相关信息,然后继续通过 client-go 获取对应 pod 的日志,然后把这些信息放到 map 中。
8/14/2025 1:11:00 AM
乔克
马斯克手撕OpenAI,奥特曼反击:AI巨头互曝老底,苹果被拖下水
8月12日,埃隆·马斯克在社交平台X上发布了一则爆炸性指控。 他声称,苹果正在利用App Store的机制,使得除了OpenAI之外的任何AI公司都无法登上榜首。 图片马斯克将此行为称作“明确的反垄断行为”,并表示其旗下公司xAI将立即采取法律行动。
8/13/2025 6:30:56 PM
OpenAI和奥特曼将投资一家脑机接口公司,直接与马斯克的Neuralink竞争
Neuralink,一家或许代表着人与机器共生未来的公司,或将迎来一个有力的挑战者。 据《金融时报》报道,OpenAI 及其联合创始人山姆・奥特曼正准备投资一家名为 Merge Labs 的创业公司,该公司的目标与伊隆・马斯克的 Neuralink 一致,都是连接人脑与计算机。 无疑,此举将加剧这两位亿万富翁企业家之间的竞争。
8/13/2025 9:22:12 AM
和GPT聊了21天,我差点成为陶哲轩
一个高中都没毕业的加拿大老哥,在ChatGPT的“鼓励”下:用21天、300个小时、9万字的对话,发明了一套号称能改变世界的原创数学理论。 从数学理论聊到跨物种对话,再到钢铁侠战衣落地,跟GPT是越聊越有。 谁曾想转头就瞬间梦碎Gemini?
8/13/2025 9:10:40 AM
ChatGPT惊现“零点击攻击”,API密钥被轻松泄露,OpenAI暂未解决
ChatGPT存在“零点击攻击”安全问题。 用户无需点击,攻击者也能从ChatGPT连接的第三方应用窃取敏感数据,甚至窃取API密钥。 一位研究软件安全问题,名为塔米尔·伊沙雅·沙尔巴特(Tamir Ishay Sharbat)的小哥发了篇文章说道。
8/13/2025 9:05:00 AM
GPT-5编程成绩有猫腻!自删23道测试题,关键基准还是自己提的
别急着用GPT-5编程了,可能它能力没有你想象中那么强。 有人发现,官方测试编程能力用的SWE-bench Verified,但货不对板,只用了477个问题。 什么意思呢?
8/13/2025 8:50:00 AM
刚刚,OpenAI内部推理模型斩获IOI 2025金牌!所有AI选手中第一
刚刚,OpenAI内部推理模型在获得IMO金牌后,又拿下了IOI金牌。 图片和上次IMO一样,OpenAI 使用了草莓形象来代表这个推理模型。 只不过这次的「草莓」不仅带上了IOI的金牌,而且更加的拟人,这个形象很有可能进化为OpenAI内部推理系统代表形象。
8/12/2025 9:46:18 AM
新智元
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
机器人
数据
大模型
Midjourney
开源
Meta
智能
微软
用户
AI新词
GPT
学习
技术
智能体
马斯克
Gemini
图像
Anthropic
英伟达
AI创作
训练
论文
代码
LLM
算法
Stable Diffusion
芯片
腾讯
苹果
AI for Science
Agent
Claude
蛋白质
开发者
生成式
神经网络
xAI
机器学习
3D
研究
人形机器人
生成
AI视频
百度
工具
RAG
大语言模型
Sora
华为
GPU
计算
具身智能
AI设计
字节跳动
搜索
大型语言模型
AGI
场景
深度学习
视频生成
架构
预测
视觉
伟达
DeepMind
Transformer
编程
神器推荐
AI模型
亚马逊
MCP