AIGC宇宙 AIGC宇宙

理论

硬核拆解!从GPT-2到gpt-oss,揭秘大模型进化关键密码

8月5日,在GPT-5发布前两天,OpenAI推出了它的两款开源权重大语言模型:gpt-oss-120b、gpt-oss-20b。 这是自2019年GPT-2,近六年来OpenAI首次发布开放权重的模型。 得益于巧妙的优化技术,这些模型甚至可以在本地设备上运行。
8/18/2025 9:15:00 AM

大模型给自己当裁判并不靠谱!上海交通大学新研究揭示LLM-as-a-judge机制缺陷

大语言模型(LLM)正从工具进化为“裁判”(LLM-as-a-judge),开始大规模地评判由AI自己生成的内容。 这种高效的评估范式,其可靠性与人类判断的一致性,却很少被深入验证。 一个最基础、却也最关键的问题是:在评判一个模型是否“入戏”之前,AI裁判能准确识别出对话中到底是谁在说话吗?
8/18/2025 9:00:00 AM

谷歌最新「0.27B」Gemma 3开源!身板小却猛如虎,开发者直呼救命稻草

大块头不等于大智慧。 这在生成式AI领域,已逐渐成为共识。 Gemma 3系列的成功就是一个很好的例证。
8/18/2025 8:57:00 AM

破天荒!OpenAI、Cursor多位开发大牛联手曝出GPT5提示词指南!晒官方系统提示词优化秘籍,最大化编程性能,工作流更可控

编辑 | 云昭上周,GPT-5 发布以后,不少网友对这个备受期待的新版本表示无力吐槽。 OpenAI 老板 Altman 在直播间宣称,GPT-5 在自主任务执行能力、编程、综合智能以及可控性方面都实现了显著飞跃。 然而,用户实际用起来却是:“降智”、“Token很快用完”的声讨一片。
8/15/2025 3:02:46 PM
云昭

OpenAI华人露头就被小扎挖!95后北大校友1个月前上直播,今天已是Meta人

又来了又来了,OpenAI华人工程师,果然露脸就被小扎挖(doge)。 这一次,主角是95后北大校友孙之清,上个月刚刚参与了ChatGPT Agent的发布直播。 当时就有不少网友调侃:发布会出镜就是在给Meta提供挖角名单。
8/15/2025 12:27:27 PM

OpenAI波兰双雄:GPT不是偶然!再忆奥特曼被逐当天实况

OpenAI早期,据说午餐时大家太紧张,以至于不敢说话,现在的氛围轻松许多。 甚至OpenAI早期有个「波兰帮」,比如联合创始人Wojciech Zaremba(下图左),后来在编程竞赛击败ChatGPT的信息学奥赛金牌选手Przemysław Debiak(下图右)。 图片还有两位黄金级搭档Jakub Pachocki和Szymon Sidor:现首席科学家Jakub Pachocki,奥特曼称赞为「我们这一代最杰出的头脑之一」;OpenAI技术Fellow、前者的高中同学Szymon Sidor。
8/15/2025 11:54:04 AM
新智元

OpenAI回归开源:gpt-oss-120b和gpt-oss-20b完整指南

译者 | 陈峻审校 | 重楼本文将向你介绍OpenAI新发布的两个开源模型--gpt-oss-120b和gpt-oss-20b,它们的特点,以及在何种场景下该使用哪个模型。 近期,OpenAI发布了两个开源的大语言模型(LLM)--gpt-oss-120b和gpt-oss-20b。 它们是自GPT-2以来,由OpenAI第一个公开许可的LLM。
8/15/2025 8:17:41 AM
陈峻

被曝蒸馏DeepSeek还造假!欧版OpenAI塌房了

离职掀桌! Mistral被曝“蒸馏”DeepSeek。 网友在推特上爆料,一位Mistral离职女员工群发邮件,直指公司多项黑幕。
8/14/2025 6:22:29 PM

ChatGPT会让大脑退化?OpenAI高管用它救下自己「读写障碍」的女儿

ChatGPT会导致大脑退化吗? 它只是一个作弊工具吗? 加入OpenAI之前,Leah Belsky已经在教育领域工作了15年,从世界银行到Coursera,专注于「让教育惠及全球」这一使命。
8/14/2025 6:15:33 PM

OpenAI们都错了!AI教父辛顿再发警告:控制AI是妄想!必须让AI成为“母亲”,学会主动关心人类!李飞飞当场反驳:构想不对!

编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)人类试图控制AI的方式犯了本质错误! 昨日,“AI教父”辛顿(Geoffrey Hinton)在Ai4 行业大会上的发言再次掀起热议。 这位曾警告“AI消灭人类的概率在10%到20%之间”的人工智能先驱,这次把矛头直接对准科技巨头——他质疑,那些试图让人类在所谓“顺从”的AI面前维持“主导地位”的做法,根本行不通。
8/14/2025 3:42:55 PM
伊风

Agent 产品如何定价?我们花的钱,究竟值不值?

一方面,我们对Agent的期望是成为一个可靠、高效、且不知疲倦的伙伴;另一方面,现实体验却常常被一些“意外”打断:资源瓶颈的窘境:在执行关键任务的冲刺阶段,系统突然弹出“积分/点数已耗尽”的提示,如同汽车在距离目的地一公里处耗尽燃油,进程戛然而止。 性能波动的无奈:用户时常面临算力“堵车”的困境,Agent的响应速度时快时慢,尤其在服务高峰期,其表现更像一个“兼职员工”,而非全天候的专业助理。 DeepSeek等前沿应用在发布初期因用户激增而导致的服务器高负载现象,便是这一挑战的缩影。
8/14/2025 11:13:59 AM
DataFun

AIOps系列 | 开发 K8s GPT 故障诊断工具

前面我们介绍了 《开发 K8s Chat 命令行工具》,实现了通过和 Kubernetes 进行交互的方式进行运维,虽然文章中所描述的功能比较简单,但是可以以此进行扩展,丰富功能。 那本章,我们将在 《开发 K8s Chat 命令行工具》的基础之上,增加 Kubernetes 故障诊断工具,其主要功能点是:获取集群的 event 时间,特别关注 warning 级别事件然后进入对应的 pod 获取日志大模型结合事件和日志进行分析,得出解决问题的建议当然,这里也只是起到一个抛砖引玉的作用,提供简单的思路,可以自行扩展。 开发过程(1)首先使用 cobra-cli 新增一个 analyze 命令复制(2)然后在 analyze 下面添加一个子命令 event,专门用于分析事件复制(3)设计一个方法 getPodEventsAndLogs 用于获取 K8s 的事件和日志复制我们使用一个 map[string][]string 来保存 pod 的事件和日志信息,然后通过 client-go 获取 warning 级别的事件,最后过滤需要的 pod 事件以及 pod 相关信息,然后继续通过 client-go 获取对应 pod 的日志,然后把这些信息放到 map 中。
8/14/2025 1:11:00 AM
乔克

马斯克手撕OpenAI,奥特曼反击:AI巨头互曝老底,苹果被拖下水

8月12日,埃隆·马斯克在社交平台X上发布了一则爆炸性指控。 他声称,苹果正在利用App Store的机制,使得除了OpenAI之外的任何AI公司都无法登上榜首。 图片马斯克将此行为称作“明确的反垄断行为”,并表示其旗下公司xAI将立即采取法律行动。
8/13/2025 6:30:56 PM

OpenAI和奥特曼将投资一家脑机接口公司,直接与马斯克的Neuralink竞争

Neuralink,一家或许代表着人与机器共生未来的公司,或将迎来一个有力的挑战者。 据《金融时报》报道,OpenAI 及其联合创始人山姆・奥特曼正准备投资一家名为 Merge Labs 的创业公司,该公司的目标与伊隆・马斯克的 Neuralink 一致,都是连接人脑与计算机。 无疑,此举将加剧这两位亿万富翁企业家之间的竞争。
8/13/2025 9:22:12 AM

和GPT聊了21天,我差点成为陶哲轩

一个高中都没毕业的加拿大老哥,在ChatGPT的“鼓励”下:用21天、300个小时、9万字的对话,发明了一套号称能改变世界的原创数学理论。 从数学理论聊到跨物种对话,再到钢铁侠战衣落地,跟GPT是越聊越有。 谁曾想转头就瞬间梦碎Gemini?
8/13/2025 9:10:40 AM

ChatGPT惊现“零点击攻击”,API密钥被轻松泄露,OpenAI暂未解决

ChatGPT存在“零点击攻击”安全问题。 用户无需点击,攻击者也能从ChatGPT连接的第三方应用窃取敏感数据,甚至窃取API密钥。 一位研究软件安全问题,名为塔米尔·伊沙雅·沙尔巴特(Tamir Ishay Sharbat)的小哥发了篇文章说道。
8/13/2025 9:05:00 AM

GPT-5编程成绩有猫腻!自删23道测试题,关键基准还是自己提的

别急着用GPT-5编程了,可能它能力没有你想象中那么强。 有人发现,官方测试编程能力用的SWE-bench Verified,但货不对板,只用了477个问题。 什么意思呢?
8/13/2025 8:50:00 AM

刚刚,OpenAI内部推理模型斩获IOI 2025金牌!所有AI选手中第一

刚刚,OpenAI内部推理模型在获得IMO金牌后,又拿下了IOI金牌。 图片和上次IMO一样,OpenAI 使用了草莓形象来代表这个推理模型。 只不过这次的「草莓」不仅带上了IOI的金牌,而且更加的拟人,这个形象很有可能进化为OpenAI内部推理系统代表形象。
8/12/2025 9:46:18 AM
新智元