AIGC宇宙 AIGC宇宙

大模型

本命周!MiniMax M1有多猛?网友:仅用40k思考预算就干翻Gemini,实测:真·超DS!生产环境下更划算!但还不够美观

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)大模型的内卷远远没有结束了。 今天凌晨,MiniMax 扔出了一记重磅炸弹——MiniMax-M1。 先来看看,M1 有多猛?
6/17/2025 2:49:18 PM
云昭

​谷歌被指用 ChatGPT 提升 Gemini,Scale AI 坚决否认

根据近期的报道,谷歌在生成式人工智能领域的竞争似乎正面临新的挑战。 尽管谷歌拥有强大的云计算能力和丰富的人才资源,但在与微软和 OpenAI 的竞争中,谷歌常常被视为处于劣势地位。 微软首席执行官萨提亚・纳德拉曾指出,谷歌在人工智能领域错失了良机,这引发了谷歌母公司 Alphabet 的首席执行官桑达尔・皮查伊的强烈回应。
6/17/2025 9:02:17 AM
AI在线

谷歌被曝用 ChatGPT 训练 Gemini,Scale AI 否认

有文件显示谷歌承包商或用 ChatGPT 训练改进 Bard(现谷歌 Gemini),Scale AI 否认。同时,Meta 拟 143 亿美元部分收购 Scale AI,谷歌不满或终止合作。#谷歌 #Gemini #ChatGPT
6/17/2025 8:11:50 AM
远洋

AI 黑话太多看不懂?一文帮你打通:AI, 机器学习, 大模型, LLM, Agent 都是啥关系?

最近是不是感觉整个世界都在聊AI? 从ChatGPT、Sora、到Cursor… 人工智能正以前所未有的速度和广度渗透进我们的生活和工作。 伴随而来的是一堆高频词汇:大模型(Large Model)、LLM(Large Language Model)、机器学习(Machine Learning)、深度学习(Deep Learning,虽然你没问,但它太重要了,我们也会提一下)、还有最新的智能体(Agent)……哎呀,听得多了,感觉脑袋都成了一锅粥。
6/16/2025 10:05:00 AM
徐述

放弃博士学位加入OpenAI,他要为ChatGPT和AGI引入记忆与人格

今天,一位研究者加入 OpenAI 的消息吸引了很多人的关注。 这位研究者名为 James Campbell,他才于 2024 年攻读 CMU 的计算机科学博士学位。 现在,他突然宣布要放弃博士学业,加入 OpenAI。
6/16/2025 7:50:00 AM
机器之心

AI记忆伪装被戳穿!GPT、DeepSeek等17款主流大模型根本记不住数字

在进入本文之前,我们先来玩个 10 秒小游戏:在心里选一个「1-10」的整数。 现在设想我问:「你想的是 5 吗? 」如果听到是自己的数字,你会本能地答 Yes,其余统统 No。
6/16/2025 6:00:00 AM
机器之心

越脏越安全?哈佛团队研究:10%毒性训练让大模型百毒不侵

最近,一项关于 4chan 的“毒性”实验颠覆了 AI 社区的集体直觉:        ——原来,适度地喂模型吃“毒”,反而能让它更容易“解毒”。 长期以来,大模型训练的默认路线是“干净数据优先”。 OpenAI、Anthropic、Google DeepMind 等公司,都花费巨资雇佣标注团队,把网络文本里的暴力、歧视、骚扰言论清洗得一干二净——因为没人愿意让自己的模型变成“种族主义诗人”或“厌女主义讲师”。
6/16/2025 3:00:00 AM

谷歌搜索推出音频概览功能:AI 生成播客式总结

谷歌搜索推出音频概览功能,利用Gemini模型生成AI播客式总结,两位虚拟主持人互动讲解搜索结果。用户可调整音量和播放速度,还能进一步探索信息来源。#谷歌新功能# #AI应用#
6/15/2025 2:16:47 PM
远洋

苹果大模型智商归零论文刷屏,是革命,还是自曝式搬起石头打自己的脚?大牛犀利锐平:苹果真正的问题,不是论文写得刺耳,而是产品太难看

编译 | 云昭出品 | 51CTO技术栈(微信号:blog51cto). 近日,苹果被爆出了两个大事:一篇极具争议的论文,一场颇受质疑的新发布。 最吊诡的是,iOS26新发布的热度还没有一篇论文引起的反响更强烈!
6/13/2025 1:14:10 PM
云昭

TypeScript 杀疯了,开发 AI 应用新趋势!

随着 AI 技术的迅猛发展,越来越多开发者开始构建基于大模型(LLM)、多智能体协作、浏览器端推理等新型应用。 在这一浪潮中,TypeScript 凭借其强大的类型系统、成熟的工具链和活跃的生态,正逐步成为现代 AI 应用开发的主流选择之一。 根据 Y Combinator 统计,约有 60% 至 70% 的 AI Agent 初创公司采用 TypeScript 开发。
6/13/2025 11:25:04 AM
CUGGZ

强化预训练(RPT):LLM 预训练新范式,当模型学会战略思考

大家好,我是肆〇柒。 在当下,大型语言模型(LLM)正以其卓越的能力在诸多任务中引人瞩目。 这些能力的提升,很大程度上得益于在大规模文本数据上的 next-token-prediction 自监督学习范式。
6/13/2025 9:29:51 AM
肆零柒

2025上半年大模型领域盘点:创新与争议交织前行

随着大模型的快速迭代,该技术不仅成为了驱动科技发展的重要动力,同时也是推动社会各领域智能化转型的关键力量。 2025年上半年,大模型领域迎来了快速发展与变革。 从DeepSeek发布其推理大模型R1,到百度宣布大模型开源,再到多家厂商纷纷推出大模型一体机,这些事件共同推动了大模型技术在硬件解决方案上的显著进步。
6/13/2025 3:30:00 AM
Yu

谷歌首次增设“首席 AI 架构师”职位,大力加码人工智能战略

谷歌近年来持续整合 DeepMind 与公司整体架构,并试图将其AI技术商业化。不过,尽管行业内技术快速演进,AI仍未为多数公司带来显著回报。与此同时,资本支出却持续攀升。
6/12/2025 11:56:33 AM
清源

简易实用项目攻略:如何创建集文档问答、摘要、转录、翻译与提取于一身的AI门户

译者 | 核子可乐审校 | 重楼如今AI虽已全面普及,但多数职场人士仍难以统一运用各类互不相关的工具:一会需要使用聊天机器人、一会需要将文本复制到摘要器内,再加上会议转录和翻译,将本应顺畅的工作流程拆分得零散琐碎。 所以问题来了:为什么不能把各项AI功能集中起来? 为此我决定构建单一Web门户,供用户随时上传文档、提问、获取摘要、转录会议内容、翻译文件,甚至从PDF中提取表格等。
6/12/2025 8:24:57 AM
核子可乐

刚刚!OpenAI 上线 o3-pro,性能碾压 Gemini 与 Claude,重新定义“模型”

OpenAI发布了它自称“迄今为止最强大”的模型:o3-pro。   ——这是此前发布的推理模型 o3 的“加强版”。 图片o3-pro属于“推理模型”,它可以一步步拆解问题、逻辑严密地得出结论。
6/11/2025 2:48:11 PM

小红书开源首个 AI 文本大模型:11.2T 精炼语料吊打海量数据,证明“大模型≠大数据”

近日,在中文开源大模型愈发稀缺的背景下,小红书旗下 hi lab 公布了中等规模的 MoE 模型 dots.llm1,以 1420 亿总参数、每次仅激活 140 亿参数的设计,达成与 Qwen2.5-72B 相近的性能,吸引了社区的关注。 图片据悉,dots.llm1 是一个 Mixture of Experts(MoE)结构的语言模型。 尽管总参数规模达 142B,但在每次推理中只激活 14B,有效控制了计算开销。
6/11/2025 2:44:48 PM

o3 pro一手真体验!上下文喂到断供!大神:o3 pro不会聊天,上帝渴望上下文,认知能力降维打击Gemini、Claude

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)经历了 5 月份的“买买买”的节奏之后,6月的 OpenAI 终于开始对谷歌的Gemini 2.5 Pro 发起了反击。 今天凌晨,Sam Altman 动作非常密集。 先是宣布 o3 价格“截肢”(价格直接降至 1/5 ),紧接着不到 2 小时后就发布了 o3-pro。
6/11/2025 12:44:40 PM
云昭

60%情况下,主流大模型没理解风险只是装懂!别被模型的“安全答案”骗了

让推理模型针对风险指令生成了安全输出,表象下藏着认知危机:即使生成合规答案,超60%的案例中模型并未真正理解风险。 换句话说,主流推理模型的安全性能存在系统性漏洞。 针对此种现象,淘天集团算法技术-未来实验室团队引入「表面安全对齐」(Superficial Safety Alignment, SSA)这一术语来描述这种系统性漏洞。
6/10/2025 11:25:06 AM