理论

越脏越安全？哈佛团队研究：10%毒性训练让大模型百毒不侵

最近，一项关于 4chan 的“毒性”实验颠覆了 AI 社区的集体直觉： ——原来，适度地喂模型吃“毒”，反而能让它更容易“解毒”。长期以来，大模型训练的默认路线是“干净数据优先”。 OpenAI、Anthropic、Google DeepMind 等公司，都花费巨资雇佣标注团队，把网络文本里的暴力、歧视、骚扰言论清洗得一干二净——因为没人愿意让自己的模型变成“种族主义诗人”或“厌女主义讲师”。

6/16/2025 3:00:00 AM

我用这两个提示在 ChatGPT 中创建了 7 万多个提示

当发现越来越多的人喜欢自己的提示时，便萌生了产出更多高品质提示的想法。为了深入了解他人都在设计哪些提示，不得不上网搜索各种示例和灵感。最终，灵光一现：为何不先定义一组“超大角色提示”模板，再配套一套“后续跟进提示”模板，以此批量生成所需内容？

6/16/2025 1:33:00 AM

前端小智

5000次风暴，谷歌训出AI预言家！天气预报ChatGPT时刻？

昨天，谷歌DeepMind与谷歌研究团队正式推出交互式气象平台Weather Lab，用于共享人工智能天气模型。图片在热带气旋路径预测方面，谷歌这次的新模型刷新SOTA，是首个在性能上明确超越主流物理模型的AI预测模型。图片论文链接：：：，所经之处，徒留废墟。

6/13/2025 4:02:04 PM

新智元

o3-pro答高难题文字游戏引围观，OpenAI前员工讽刺苹果：这都不叫推理那什么叫推理

OpenAI“最新最强版”推理模型o3-pro，实际推理能力到底有多强？全球首位全职提示工程师Riley Goodside来给它上难度：说出歌手Sabrina Carpenter的一首歌的歌名，回答这个问题时，每个单词最后一个字母连起来看，也能对应这首歌名。图片结果，o3-pro在经过4分25秒的推理过后，成功给出正确答案。

6/13/2025 2:15:57 PM

苹果大模型智商归零论文刷屏，是革命，还是自曝式搬起石头打自己的脚？大牛犀利锐平：苹果真正的问题，不是论文写得刺耳，而是产品太难看

编译 | 云昭出品 | 51CTO技术栈（微信号：blog51cto）. 近日，苹果被爆出了两个大事：一篇极具争议的论文，一场颇受质疑的新发布。最吊诡的是，iOS26新发布的热度还没有一篇论文引起的反响更强烈！

6/13/2025 1:14:10 PM

云昭

TypeScript 杀疯了，开发 AI 应用新趋势！

随着 AI 技术的迅猛发展，越来越多开发者开始构建基于大模型（LLM）、多智能体协作、浏览器端推理等新型应用。在这一浪潮中，TypeScript 凭借其强大的类型系统、成熟的工具链和活跃的生态，正逐步成为现代 AI 应用开发的主流选择之一。根据 Y Combinator 统计，约有 60% 至 70% 的 AI Agent 初创公司采用 TypeScript 开发。

6/13/2025 11:25:04 AM

CUGGZ

强化预训练（RPT）：LLM 预训练新范式，当模型学会战略思考

大家好，我是肆〇柒。在当下，大型语言模型（LLM）正以其卓越的能力在诸多任务中引人瞩目。这些能力的提升，很大程度上得益于在大规模文本数据上的 next-token-prediction 自监督学习范式。

6/13/2025 9:29:51 AM

肆零柒

如何在五分钟内免费做成宝宝播客？

译者 | 布加迪审校 | 重楼你和我一样是社交达人吗？总是在寻找新的潮流和吸引观众的创新方式？如果是的话，那么你来对地方了。

6/13/2025 7:58:58 AM

布加迪

2025上半年大模型领域盘点：创新与争议交织前行

随着大模型的快速迭代，该技术不仅成为了驱动科技发展的重要动力，同时也是推动社会各领域智能化转型的关键力量。 2025年上半年，大模型领域迎来了快速发展与变革。从DeepSeek发布其推理大模型R1，到百度宣布大模型开源，再到多家厂商纷纷推出大模型一体机，这些事件共同推动了大模型技术在硬件解决方案上的显著进步。

6/13/2025 3:30:00 AM

GPT-4o宁让人类陷入危险，也不愿被关闭！OpenAI前高管敲响警钟

前OpenAI高管Steven Adler的最新研究敲响警钟，AI有时会为了避免被关闭，采取令人不安的手段，比如敲诈。基于在OpenAI的经验，Steven开始思考一个严重的问题：ChatGPT会不会为了「自保」而置用户于危险？最新研究发现，在模拟测试中，ChatGPT有时会优先考虑自身的生存，而不是保护用户的安全。

6/12/2025 2:26:01 PM

逆天！特朗普最新AI计划竟在GitHub泄露！被发现就删库跑路！白宫也要搞ChatGPT？还有一个惊人发现：项目主导者出身特斯拉

出品 | 51CTO技术栈（微信号：blog51cto）许多大模型的“上新消息”往往都不是官宣给出的，而是——不小心从 GitHub 泄露出来的。但这一次，事情比以往都更炸裂：特朗普政府的“AI接管计划”被曝出，就藏在 GitHub 的一个公开仓库里！ 6 月 10 日，有眼尖的开发者在 GitHub 上发现了这个名为“AI.gov”的项目。

6/12/2025 1:32:36 PM

伊风

前言DeepSeek-R1发布最新版本DeepSeek-R1-0528，显著提升了模型的思维深度与推理能力，在数学、编程与通用逻辑等多个基准测评中取得了当前国内所有模型中首屈一指的优异成绩，并且在整体表现上已接近其他国际顶尖模型，如 o3 与 Gemini-2.5-Pro。另外，API接口还增加了Function Calling和JsonOutput 的支持。 DeepSeek-R1团队已经证明，大模型的推理模式可以蒸馏到小模型中，与通过强化学习在小模型上发现的推理模式相比，性能更优。

6/12/2025 9:48:27 AM

简易实用项目攻略：如何创建集文档问答、摘要、转录、翻译与提取于一身的AI门户

译者 | 核子可乐审校 | 重楼如今AI虽已全面普及，但多数职场人士仍难以统一运用各类互不相关的工具：一会需要使用聊天机器人、一会需要将文本复制到摘要器内，再加上会议转录和翻译，将本应顺畅的工作流程拆分得零散琐碎。所以问题来了：为什么不能把各项AI功能集中起来？为此我决定构建单一Web门户，供用户随时上传文档、提问、获取摘要、转录会议内容、翻译文件，甚至从PDF中提取表格等。

6/12/2025 8:24:57 AM

核子可乐

刚刚！OpenAI 上线 o3-pro，性能碾压 Gemini 与 Claude，重新定义“模型”

OpenAI发布了它自称“迄今为止最强大”的模型：o3-pro。 ——这是此前发布的推理模型 o3 的“加强版”。图片o3-pro属于“推理模型”，它可以一步步拆解问题、逻辑严密地得出结论。

6/11/2025 2:48:11 PM

小红书开源首个 AI 文本大模型：11.2T 精炼语料吊打海量数据，证明“大模型≠大数据”

近日，在中文开源大模型愈发稀缺的背景下，小红书旗下 hi lab 公布了中等规模的 MoE 模型 dots.llm1，以 1420 亿总参数、每次仅激活 140 亿参数的设计，达成与 Qwen2.5-72B 相近的性能，吸引了社区的关注。图片据悉，dots.llm1 是一个 Mixture of Experts（MoE）结构的语言模型。尽管总参数规模达 142B，但在每次推理中只激活 14B，有效控制了计算开销。

6/11/2025 2:44:48 PM

o3 pro一手真体验！上下文喂到断供！大神：o3 pro不会聊天，上帝渴望上下文，认知能力降维打击Gemini、Claude

编辑 | 云昭出品 | 51CTO技术栈（微信号：blog51cto）经历了 5 月份的“买买买”的节奏之后，6月的 OpenAI 终于开始对谷歌的Gemini 2.5 Pro 发起了反击。今天凌晨，Sam Altman 动作非常密集。先是宣布 o3 价格“截肢”（价格直接降至 1/5 ），紧接着不到 2 小时后就发布了 o3-pro。

6/11/2025 12:44:40 PM

云昭