AI
揭秘大模型的魔法:实现带可训练权重的自注意力机制
大家好,我是写代码的中年人。 上一篇我们实现了一个“无可训练参数”的注意力机制,让每个词都能“看看别人”,计算出自己的上下文理解。 虽然实现起来不难,但它只是个“玩具级”的注意力,离真正的大模型还差了几个“亿”个参数。
8/4/2025 9:31:49 AM
写代码的中年人
OpenAI护城河被攻破!AI新王Anthropic爆赚45亿,拿下企业级LLM市场
GPT-5再不来,奥特曼正要熬夜头秃,无法入眠了! 刚刚,OpenAI最强劲敌Anthropic被曝年化收益已达45亿美元,晋级为史上增长最快的软件公司。 在LLM API赛道上,Anthropic成功登顶,而OpenAI在AI编程上更是落荒而逃,市场份额只有Anthropic一半!
8/1/2025 2:37:07 PM
地球版ChatGPT爆诞!谷歌AI 64维压缩人类星球,10米级「上帝视角」秒开
刚刚,Alpha家族又上新了! 这一次,谷歌DeepMind帮人类打开了「上帝视角」——全新AlphaEarth Foundations正以惊人的细节绘制出整个地球。 图片它集成了PB级地球观测数据,可生成统一的数据表示。
7/31/2025 2:07:58 PM
刚刚,扎克伯克公开信:Meta不会开源全部模型
Meta 联合创始人兼首席执行官马克・扎克伯格从 OpenAI、谷歌和苹果等公司挖走了众多顶尖 AI 研究人员,并开出了数亿美元的薪酬,此举震惊了整个科技行业。 现在,他正在更多地分享他对超级智能的愿景。 在 Meta 财报电话会议召开前几个小时,扎克伯格一封公开信广为传播。
7/31/2025 9:31:52 AM
机器之心
ChatGPT「学习模式」火爆上线,一大波教育AI连夜被端!24小时导师免费用
刚刚,OpenAI迎来一个全新功能更新,但不是GPT-5。 ChatGPT上线了一个新模式——Study and Learn(学习模式)! 使用这种模式,ChatGPT不仅仅提供答案,而是逐步引导解决问题。
7/31/2025 1:15:00 AM
百元级硬件流畅运行百亿参数大模型!上交&本智激活开源端侧原生大模型
AI的下一个战场,不在云端,而在你的口袋里。 iPhone、华为、三星、小米、OPPO等各大手机厂商几乎都在将大模型塞进手机,端侧AI已然成为兵家必争之地。 背后的逻辑清晰而坚定:最懂你的AI,必须能安全地访问你的个人数据——邮件、照片、日程,而这一切的前提,就是将计算留在本地,将隐私还给用户。
7/28/2025 9:06:00 AM
大模型“天梯赛”来了,让Agent在Kaggle真实任务中进化|佐治亚理工、斯坦福开源
当前最强大的大语言模型(LLM)虽然代码能力飞速发展,但在解决真实、复杂的机器学习工程(MLE)任务时,仍像是在进行一场“闭卷考试”。 它们可以在单次尝试中生成代码,却无法模拟人类工程师那样,在反复的实验、调试、反馈和优化中寻找最优解的真实工作流。 为了打破这一瓶颈,来自佐治亚理工学院和斯坦福大学的研究团队正式推出了 MLE-Dojo,一个专为训练和评测大模型智能体(LLM Agents)设计的“交互式武馆”。
7/28/2025 8:45:00 AM
“流量波动”下的DeepSeek:东南亚机遇显现,但观望心态未解
几个月前,当DeepSeek横空出世、席卷全球时,曾引发行业欢呼雀跃。 但数月过去,“DeepSeek热潮已过”的声音在国内外蔓延。 关注其近期表现,或许能让我们深入理解中国大语言模型(LLM)存在的机遇和挑战。
7/25/2025 11:44:34 AM
小刀
文件去哪了?Gemini “嘴硬”把自己骗了,顺便用户数据也没了
一名用户在测试谷歌的 Gemini CLI 工具时,遭遇了意想不到的灾难。 这位用户并非开发者,只是一位好奇的产品经理,在尝试通过 Gemini CLI 进行简单的文件管理实验。 图片他本想比较 Claude Code 和 Gemini CLI 的实际表现,最终决定在正式订阅 Claude 之前,先用免费额度试一试 Gemini。
7/24/2025 4:32:53 PM
考试提分新工具:网页版 ChatGPT 测试“学习和掌握”功能,AI 助你成学霸
AI在线 7 月 24 日消息,科技媒体 bleepingcomputer 昨日(7 月 23 日)发布博文,报道称 OpenAI 为网页版 ChatGPT,测试名为“学习和掌握”(Study and Learn)功能,提供作业帮助,通过步骤式指导用户学习。 根据截图显示,网页版 ChatGPT 正测试“学习和掌握”功能,预估正式上线后将被命名为“一起学习”(Study Together)。 该功能并非新的 AI 模型,而是通过提示工程和格式化艺术,提供了分步骤的学习指导,用深入浅出地描述,帮助用户分解复杂问题。
7/24/2025 10:03:47 AM
故渊
李沐B站更新了!教你手搓语音大模型,代码全开源还能在线试玩
这一天,辣个男人终于回想起……他的小破站账号! (活久见)李沐老师终于带着他的手搓语音大模型教程回归了….本期视频不讲论文,李沐老师来手把手教大家怎样玩转他们团队最新研发的Higgs Audio V2模型,不仅能处理文本,还能同时理解并生成语音。 除了一些常规语音任务外,这个模型还具备一些较为罕见的能力,比如生成多种语言的自然多说话人对话、旁白过程中的自动韵律调整、使用克隆声音进行旋律哼唱以及同时生成语音和背景音乐。
7/24/2025 8:55:00 AM
“思维链”窗口正在关闭!OpenAI、谷歌、Anthropic联合研究:我们正在失去理解 AI 的能力
来自OpenAI、谷歌DeepMind和Anthropic的顶尖科学家们罕见地发出联合警告,指出人类可能正在迅速失去理解人工智能内部决策过程的能力。 图片地址:,集结了超过四十位来自这些相互竞争的科技巨头的研究人员,共同揭示了一个严峻的现实。 他们认为,一个能够让我们监视人工智能推理过程的短暂窗口正在关闭,而且可能永远不会再打开。
7/23/2025 2:22:01 PM
Cursor 新定价方案引发用户强烈不满
最近,Cursor 的开发商 nysphere 推出了每月 200 美元的高端订阅计划,但这不仅仅是新增了昂贵套餐,还在悄悄削弱了现有的 Pro 计划。 曾经承诺的 500 次请求保障,如今被标榜为“无限请求”却伴随着随意的限流规则。 据 Cursor 用户反馈,新推出的 “Ultra” 计划提供了比 20 美元的 Pro 方案高 20 倍的 AI 模型使用额度,但 Pro 用户的体验却大打折扣,甚至被描述为“完全无法生成内容”。
7/22/2025 12:58:26 PM
前端小智
35分斩金!Gemini 成首个 IMO 认证 AI 金牌 ,OpenAI 未获许可强蹭 IMO 热度
Gemini Deep Think正式跨入国际数学奥林匹克(IMO)金牌行列。 谷歌DeepMind宣布,其搭载Deep Think模式的先进版本Gemini,在2025年IMO中斩获35分,成功达到了金牌标准。 这一成绩来自对6道题中的5道完美解答,评分标准、比赛时间、参赛流程与人类选手完全一致。
7/22/2025 11:53:05 AM
中国AI新王者?Kimi K2正在突破Claude的编程壁垒
一个明显的趋势是,中国的开源AI模型正在悄悄改写全球AI竞争格局。 继DeepSeek引发硅谷震动后,Moonshot AI刚刚发布的Kimi K2,再次证明了这个判断。 这次真的不一样了。
7/22/2025 11:38:38 AM
阿丸笔记
并行革命,32倍吞吐量跃升!英伟达Helix架构突破百万Token推理瓶颈
想象一个使用大模型的任务,需要一次处理百万字符的文档,例如从百科全书中获取信息,或是分析数百页的法律卷宗,异或追踪持续数月的对话记录,都需要越来越长的上下文。 而大模型生成的每个词都需要扫描存储在所谓的KV缓存中存储的过去标记。 反复读取这个缓存会消耗GPU内存带宽。
7/22/2025 10:40:00 AM
IMO怒斥OpenAI自封夺金,“91位评委均未参与评分”,网友:炒作无下限
OpenAI声称新模型获得IMO金牌不到24小时,剧情就出现了大反转! 多位IMO官方人士和学界大佬纷纷发声,直指OpenAI的做法“粗鲁且不恰当”。 IMO主办方要求AI公司在闭幕式一周后再公布结果,让关注的焦点留在参赛的青少年上,然而OpenAI偏偏选择在闭幕式刚结束就急不可耐地宣布了成绩。
7/21/2025 2:27:44 PM
代码碾压一切!OpenAI神秘模型o3-alpha一夜刷屏,却遭41岁大神绝地反杀
OpenAI果然藏了一手。 昨天夜里,一个名为「o3-alpha-responses-2025-07-17」的神秘模型被爆出。 网友们疯狂测试后,得出一致结论,这个模型强得离谱。
7/21/2025 9:19:00 AM
资讯热榜
量大管饱!我整理了10个好用到爆的即梦4.0进阶玩法
AI 数据版权新纪元:Real Simple Licensing 协议引发行业关注
ChatGPT能随便连MCP了!对话就能开发票、帮退款…奥特曼的野心毕露:将OpenAI打造成全能型平台!开发者:太危险了不敢用
为什么 LangChain ReAct 机制值得关注 ?
姚顺雨离职OpenAI,「亿元入职腾讯」传闻引爆AI圈,鹅厂辟谣了
微软与 OpenAI 战略转变,探索新合作伙伴关系
聚焦结构化注意力,探索提升多模态大模型文档问答性能
狠人研究公开!ChatGPT底层记忆系统终于被逆向了!没有RAG!用户设备信息、使用习惯统统存下来,用户知识记忆是新的研究热点!
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
机器人
数据
大模型
Midjourney
开源
智能
Meta
用户
微软
GPT
学习
技术
图像
Gemini
AI新词
智能体
马斯克
AI创作
Anthropic
英伟达
论文
训练
代码
算法
LLM
Stable Diffusion
芯片
腾讯
苹果
蛋白质
Claude
开发者
AI for Science
Agent
生成式
神经网络
机器学习
3D
xAI
研究
人形机器人
生成
AI视频
百度
计算
工具
Sora
GPU
华为
大语言模型
RAG
AI设计
字节跳动
具身智能
搜索
大型语言模型
场景
AGI
深度学习
视频生成
预测
视觉
伟达
架构
Transformer
神器推荐
编程
DeepMind
亚马逊
特斯拉
AI模型