大模型

AI记忆伪装被戳穿！GPT、DeepSeek等17款主流大模型根本记不住数字

在进入本文之前，我们先来玩个 10 秒小游戏：在心里选一个「1-10」的整数。现在设想我问：「你想的是 5 吗？」如果听到是自己的数字，你会本能地答 Yes，其余统统 No。

6/16/2025 6:00:00 AM

机器之心

越脏越安全？哈佛团队研究：10%毒性训练让大模型百毒不侵

最近，一项关于 4chan 的“毒性”实验颠覆了 AI 社区的集体直觉： ——原来，适度地喂模型吃“毒”，反而能让它更容易“解毒”。长期以来，大模型训练的默认路线是“干净数据优先”。 OpenAI、Anthropic、Google DeepMind 等公司，都花费巨资雇佣标注团队，把网络文本里的暴力、歧视、骚扰言论清洗得一干二净——因为没人愿意让自己的模型变成“种族主义诗人”或“厌女主义讲师”。

6/16/2025 3:00:00 AM

谷歌搜索推出音频概览功能：AI 生成播客式总结

谷歌搜索推出音频概览功能，利用Gemini模型生成AI播客式总结，两位虚拟主持人互动讲解搜索结果。用户可调整音量和播放速度，还能进一步探索信息来源。#谷歌新功能# #AI应用#

6/15/2025 2:16:47 PM

远洋

苹果大模型智商归零论文刷屏，是革命，还是自曝式搬起石头打自己的脚？大牛犀利锐平：苹果真正的问题，不是论文写得刺耳，而是产品太难看

编译 | 云昭出品 | 51CTO技术栈（微信号：blog51cto）. 近日，苹果被爆出了两个大事：一篇极具争议的论文，一场颇受质疑的新发布。最吊诡的是，iOS26新发布的热度还没有一篇论文引起的反响更强烈！

6/13/2025 1:14:10 PM

云昭

TypeScript 杀疯了，开发 AI 应用新趋势！

随着 AI 技术的迅猛发展，越来越多开发者开始构建基于大模型（LLM）、多智能体协作、浏览器端推理等新型应用。在这一浪潮中，TypeScript 凭借其强大的类型系统、成熟的工具链和活跃的生态，正逐步成为现代 AI 应用开发的主流选择之一。根据 Y Combinator 统计，约有 60% 至 70% 的 AI Agent 初创公司采用 TypeScript 开发。

6/13/2025 11:25:04 AM

CUGGZ

强化预训练（RPT）：LLM 预训练新范式，当模型学会战略思考

大家好，我是肆〇柒。在当下，大型语言模型（LLM）正以其卓越的能力在诸多任务中引人瞩目。这些能力的提升，很大程度上得益于在大规模文本数据上的 next-token-prediction 自监督学习范式。

6/13/2025 9:29:51 AM

肆零柒

2025上半年大模型领域盘点：创新与争议交织前行

随着大模型的快速迭代，该技术不仅成为了驱动科技发展的重要动力，同时也是推动社会各领域智能化转型的关键力量。 2025年上半年，大模型领域迎来了快速发展与变革。从DeepSeek发布其推理大模型R1，到百度宣布大模型开源，再到多家厂商纷纷推出大模型一体机，这些事件共同推动了大模型技术在硬件解决方案上的显著进步。

6/13/2025 3:30:00 AM

谷歌首次增设“首席 AI 架构师”职位，大力加码人工智能战略

谷歌近年来持续整合 DeepMind 与公司整体架构，并试图将其AI技术商业化。不过，尽管行业内技术快速演进，AI仍未为多数公司带来显著回报。与此同时，资本支出却持续攀升。

6/12/2025 11:56:33 AM

清源

简易实用项目攻略：如何创建集文档问答、摘要、转录、翻译与提取于一身的AI门户

译者 | 核子可乐审校 | 重楼如今AI虽已全面普及，但多数职场人士仍难以统一运用各类互不相关的工具：一会需要使用聊天机器人、一会需要将文本复制到摘要器内，再加上会议转录和翻译，将本应顺畅的工作流程拆分得零散琐碎。所以问题来了：为什么不能把各项AI功能集中起来？为此我决定构建单一Web门户，供用户随时上传文档、提问、获取摘要、转录会议内容、翻译文件，甚至从PDF中提取表格等。

6/12/2025 8:24:57 AM

核子可乐

刚刚！OpenAI 上线 o3-pro，性能碾压 Gemini 与 Claude，重新定义“模型”

OpenAI发布了它自称“迄今为止最强大”的模型：o3-pro。 ——这是此前发布的推理模型 o3 的“加强版”。图片o3-pro属于“推理模型”，它可以一步步拆解问题、逻辑严密地得出结论。

6/11/2025 2:48:11 PM

小红书开源首个 AI 文本大模型：11.2T 精炼语料吊打海量数据，证明“大模型≠大数据”

近日，在中文开源大模型愈发稀缺的背景下，小红书旗下 hi lab 公布了中等规模的 MoE 模型 dots.llm1，以 1420 亿总参数、每次仅激活 140 亿参数的设计，达成与 Qwen2.5-72B 相近的性能，吸引了社区的关注。图片据悉，dots.llm1 是一个 Mixture of Experts（MoE）结构的语言模型。尽管总参数规模达 142B，但在每次推理中只激活 14B，有效控制了计算开销。

6/11/2025 2:44:48 PM

o3 pro一手真体验！上下文喂到断供！大神：o3 pro不会聊天，上帝渴望上下文，认知能力降维打击Gemini、Claude

编辑 | 云昭出品 | 51CTO技术栈（微信号：blog51cto）经历了 5 月份的“买买买”的节奏之后，6月的 OpenAI 终于开始对谷歌的Gemini 2.5 Pro 发起了反击。今天凌晨，Sam Altman 动作非常密集。先是宣布 o3 价格“截肢”（价格直接降至 1/5 ），紧接着不到 2 小时后就发布了 o3-pro。

6/11/2025 12:44:40 PM

云昭

60%情况下，主流大模型没理解风险只是装懂！别被模型的“安全答案”骗了

让推理模型针对风险指令生成了安全输出，表象下藏着认知危机：即使生成合规答案，超60%的案例中模型并未真正理解风险。换句话说，主流推理模型的安全性能存在系统性漏洞。针对此种现象，淘天集团算法技术-未来实验室团队引入「表面安全对齐」（Superficial Safety Alignment, SSA）这一术语来描述这种系统性漏洞。

6/10/2025 11:25:06 AM

DeepSeek前高管秘密创业，新AI Agent项目已获顶级VC押注

据虎嗅消息，国内大模型公司DeepSeek的一位核心高管已于半年前悄然离职创业，并计划在2025年圣诞节前后推出其首款Agent产品。有接近人士向虎嗅透露，该高管曾担任DeepSeek的“CTO”角色，不过也有知情人指出，DeepSeek内部架构中并无明确设置“CTO”职位。该职位在名义上可能并不存在，但确有高管承担类似的技术统筹与研发决策职责。

6/10/2025 10:00:32 AM

AI在线