理论

硬核拆解！从GPT-2到gpt-oss，揭秘大模型进化关键密码

8月5日，在GPT-5发布前两天，OpenAI推出了它的两款开源权重大语言模型：gpt-oss-120b、gpt-oss-20b。这是自2019年GPT-2，近六年来OpenAI首次发布开放权重的模型。得益于巧妙的优化技术，这些模型甚至可以在本地设备上运行。

8/18/2025 9:15:00 AM

大模型给自己当裁判并不靠谱！上海交通大学新研究揭示LLM-as-a-judge机制缺陷

大语言模型（LLM）正从工具进化为“裁判”（LLM-as-a-judge），开始大规模地评判由AI自己生成的内容。这种高效的评估范式，其可靠性与人类判断的一致性，却很少被深入验证。一个最基础、却也最关键的问题是：在评判一个模型是否“入戏”之前，AI裁判能准确识别出对话中到底是谁在说话吗？

8/18/2025 9:00:00 AM

谷歌最新「0.27B」Gemma 3开源！身板小却猛如虎，开发者直呼救命稻草

大块头不等于大智慧。这在生成式AI领域，已逐渐成为共识。 Gemma 3系列的成功就是一个很好的例证。

8/18/2025 8:57:00 AM

破天荒！OpenAI、Cursor多位开发大牛联手曝出GPT5提示词指南！晒官方系统提示词优化秘籍，最大化编程性能，工作流更可控

编辑 | 云昭上周，GPT-5 发布以后，不少网友对这个备受期待的新版本表示无力吐槽。 OpenAI 老板 Altman 在直播间宣称，GPT-5 在自主任务执行能力、编程、综合智能以及可控性方面都实现了显著飞跃。然而，用户实际用起来却是：“降智”、“Token很快用完”的声讨一片。

8/15/2025 3:02:46 PM

云昭

OpenAI华人露头就被小扎挖！95后北大校友1个月前上直播，今天已是Meta人

又来了又来了，OpenAI华人工程师，果然露脸就被小扎挖（doge）。这一次，主角是95后北大校友孙之清，上个月刚刚参与了ChatGPT Agent的发布直播。当时就有不少网友调侃：发布会出镜就是在给Meta提供挖角名单。

8/15/2025 12:27:27 PM

OpenAI波兰双雄：GPT不是偶然！再忆奥特曼被逐当天实况

OpenAI早期，据说午餐时大家太紧张，以至于不敢说话，现在的氛围轻松许多。甚至OpenAI早期有个「波兰帮」，比如联合创始人Wojciech Zaremba（下图左），后来在编程竞赛击败ChatGPT的信息学奥赛金牌选手Przemysław Debiak（下图右）。图片还有两位黄金级搭档Jakub Pachocki和Szymon Sidor：现首席科学家Jakub Pachocki，奥特曼称赞为「我们这一代最杰出的头脑之一」；OpenAI技术Fellow、前者的高中同学Szymon Sidor。

8/15/2025 11:54:04 AM

新智元

OpenAI回归开源：gpt-oss-120b和gpt-oss-20b完整指南

译者 | 陈峻审校 | 重楼本文将向你介绍OpenAI新发布的两个开源模型--gpt-oss-120b和gpt-oss-20b，它们的特点，以及在何种场景下该使用哪个模型。近期，OpenAI发布了两个开源的大语言模型（LLM）--gpt-oss-120b和gpt-oss-20b。它们是自GPT-2以来，由OpenAI第一个公开许可的LLM。

8/15/2025 8:17:41 AM

陈峻

被曝蒸馏DeepSeek还造假！欧版OpenAI塌房了

离职掀桌！ Mistral被曝“蒸馏”DeepSeek。网友在推特上爆料，一位Mistral离职女员工群发邮件，直指公司多项黑幕。

8/14/2025 6:22:29 PM

ChatGPT会让大脑退化？OpenAI高管用它救下自己「读写障碍」的女儿

ChatGPT会导致大脑退化吗？它只是一个作弊工具吗？加入OpenAI之前，Leah Belsky已经在教育领域工作了15年，从世界银行到Coursera，专注于「让教育惠及全球」这一使命。

8/14/2025 6:15:33 PM

OpenAI们都错了！AI教父辛顿再发警告：控制AI是妄想!必须让AI成为“母亲”，学会主动关心人类！李飞飞当场反驳：构想不对！

编辑 | 伊风出品 | 51CTO技术栈（微信号：blog51cto）人类试图控制AI的方式犯了本质错误！昨日，“AI教父”辛顿（Geoffrey Hinton）在Ai4 行业大会上的发言再次掀起热议。这位曾警告“AI消灭人类的概率在10%到20%之间”的人工智能先驱，这次把矛头直接对准科技巨头——他质疑，那些试图让人类在所谓“顺从”的AI面前维持“主导地位”的做法，根本行不通。

8/14/2025 3:42:55 PM

伊风

Agent 产品如何定价？我们花的钱，究竟值不值？

一方面，我们对Agent的期望是成为一个可靠、高效、且不知疲倦的伙伴；另一方面，现实体验却常常被一些“意外”打断：资源瓶颈的窘境：在执行关键任务的冲刺阶段，系统突然弹出“积分/点数已耗尽”的提示，如同汽车在距离目的地一公里处耗尽燃油，进程戛然而止。性能波动的无奈：用户时常面临算力“堵车”的困境，Agent的响应速度时快时慢，尤其在服务高峰期，其表现更像一个“兼职员工”，而非全天候的专业助理。 DeepSeek等前沿应用在发布初期因用户激增而导致的服务器高负载现象，便是这一挑战的缩影。

8/14/2025 11:13:59 AM

DataFun

AIOps系列 | 开发 K8s GPT 故障诊断工具

前面我们介绍了《开发 K8s Chat 命令行工具》，实现了通过和 Kubernetes 进行交互的方式进行运维，虽然文章中所描述的功能比较简单，但是可以以此进行扩展，丰富功能。那本章，我们将在《开发 K8s Chat 命令行工具》的基础之上，增加 Kubernetes 故障诊断工具，其主要功能点是：获取集群的 event 时间，特别关注 warning 级别事件然后进入对应的 pod 获取日志大模型结合事件和日志进行分析，得出解决问题的建议当然，这里也只是起到一个抛砖引玉的作用，提供简单的思路，可以自行扩展。开发过程（1）首先使用 cobra-cli 新增一个 analyze 命令复制（2）然后在 analyze 下面添加一个子命令 event，专门用于分析事件复制（3）设计一个方法 getPodEventsAndLogs 用于获取 K8s 的事件和日志复制我们使用一个 map[string][]string 来保存 pod 的事件和日志信息，然后通过 client-go 获取 warning 级别的事件，最后过滤需要的 pod 事件以及 pod 相关信息，然后继续通过 client-go 获取对应 pod 的日志，然后把这些信息放到 map 中。

8/14/2025 1:11:00 AM

乔克