理论
逆天!旧Mac上能run千亿参数SOTA!效果惊人:一次生成游戏,0修改!本地大模型拐点来了!网友:别被大模型叙事带偏了(附指南)
编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)起猛了,连老电脑都能跑智谱家新一代的 SOTA 模型了! 一篇来自技术人 Simon Willison(Python 知名 Web 框架 Django 的共同创始人)的实测文章,在 Hacker News 上引发热议:“我 2.5 年高龄的旧笔记本,现在不仅能在本地跑千亿参数模型,甚至还能用它写出一款完整的 JavaScript 太空入侵者游戏。 ”图片 这个模型,正是昨天新鲜出炉的 GLM-4.5 系列。
7/30/2025 2:11:55 PM
伊风
大模型中的嵌入向量
前面文章和小伙伴们聊了 Tokenizer,经过 Tokenizer 之后,自然语言变为 Token,那么大模型就可以直接训练 Token 了嘛? 还不行! 接下来还有一个词嵌入的环境,英文就是 Embedding,Embedding 实际上就是将 Token 转为张量,在有的场景下,Embedding 也指张量本身。
7/30/2025 4:15:00 AM
江南一点雨
只需一次指令微调,大模型变身全能专家天团,8B模型性能反超全微调基线 | ACL25 Oral
只需一次指令微调,即可让普通大模型变身“全能专家天团”? 改造位置自动定位专家协作动态平衡8B模型性能反超全微调基线1.6%,安全指标暴涨10%,推理内存直降30%! 图片当前预训练语言大模型(LLM)虽具备通用能力,但适应专业领域需高昂的指令微调成本;稀疏混合专家(SMoE)架构作为可扩展的性能-效率平衡框架,虽能提升推理效率并灵活扩展模型容量,但其从头训练消耗巨大资源,因此复用密集大模型参数的升级改造(LLM Upcycling)成为更具成本效益的替代方案。
7/29/2025 2:12:00 AM
百元级硬件流畅运行百亿参数大模型!上交&本智激活开源端侧原生大模型
AI的下一个战场,不在云端,而在你的口袋里。 iPhone、华为、三星、小米、OPPO等各大手机厂商几乎都在将大模型塞进手机,端侧AI已然成为兵家必争之地。 背后的逻辑清晰而坚定:最懂你的AI,必须能安全地访问你的个人数据——邮件、照片、日程,而这一切的前提,就是将计算留在本地,将隐私还给用户。
7/28/2025 9:06:00 AM
大模型“天梯赛”来了,让Agent在Kaggle真实任务中进化|佐治亚理工、斯坦福开源
当前最强大的大语言模型(LLM)虽然代码能力飞速发展,但在解决真实、复杂的机器学习工程(MLE)任务时,仍像是在进行一场“闭卷考试”。 它们可以在单次尝试中生成代码,却无法模拟人类工程师那样,在反复的实验、调试、反馈和优化中寻找最优解的真实工作流。 为了打破这一瓶颈,来自佐治亚理工学院和斯坦福大学的研究团队正式推出了 MLE-Dojo,一个专为训练和评测大模型智能体(LLM Agents)设计的“交互式武馆”。
7/28/2025 8:45:00 AM
8个月1亿美元ARR神话:Lovable是如何"干翻"OpenAI和Cursor的?
你有没有发现,最近程序员圈子里又开始"内卷"了? 不过这次不是卷技术,而是在卷一个让人震惊的数字:8个月,1亿美元ARR。 说这个数字的时候,我自己都觉得有点不太现实。
7/28/2025 4:10:00 AM
阿丸笔记
协同 RAG-Reasoning:让大模型边想边查的“深度研究”范式
大家好我是肆〇柒。 在AI领域,大型语言模型(LLM)已经展现出卓越的语言生成能力,并在诸多任务中取得了显著成果。 然而,LLM 存在两大局限:一是知识幻觉,因其知识存储静态且参数化,易生成错误内容;二是复杂推理能力不足,难以应对现实世界的复杂问题。
7/28/2025 3:00:00 AM
肆零柒
OpenAI 多智能体研究框架:构建高效协作的AI代理系统
在人工智能快速发展的今天,单一AI模型已难以满足复杂任务的需求,多智能体系统正成为解决复杂问题的重要方向。 OpenAI推出的多智能体研究框架(Multi-AI Agent Research Framework)通过协调多个各司其职的AI代理,实现了远超单一模型的研究能力和应用价值。 本文将深入解析这一框架的核心原理、架构设计、实际应用及未来潜力,为开发者和企业提供全面的参考指南。
7/28/2025 1:33:00 AM
大模型之路
WAIC抢先爆料:金融“黑马”大模型超DeepSeek刷新SOTA,论文已上线
又到了一年一度“中国AI春晚”WAIC,各家大厂动作频发的时候。 今年会有哪些看点? 你别说,我们还真在扒论文的过程中,发现了一些热乎线索。
7/25/2025 3:24:17 PM
“流量波动”下的DeepSeek:东南亚机遇显现,但观望心态未解
几个月前,当DeepSeek横空出世、席卷全球时,曾引发行业欢呼雀跃。 但数月过去,“DeepSeek热潮已过”的声音在国内外蔓延。 关注其近期表现,或许能让我们深入理解中国大语言模型(LLM)存在的机遇和挑战。
7/25/2025 11:44:34 AM
小刀
文件去哪了?Gemini “嘴硬”把自己骗了,顺便用户数据也没了
一名用户在测试谷歌的 Gemini CLI 工具时,遭遇了意想不到的灾难。 这位用户并非开发者,只是一位好奇的产品经理,在尝试通过 Gemini CLI 进行简单的文件管理实验。 图片他本想比较 Claude Code 和 Gemini CLI 的实际表现,最终决定在正式订阅 Claude 之前,先用免费额度试一试 Gemini。
7/24/2025 4:32:53 PM
奥特曼首次透露GPT-5上手体验:在擅长领域感到无力,往后一靠感到眩晕
OpenAI掌门人奥特曼,可能是GPT-5发布前的最后一次深度访谈。 这一次,奥特曼透露了上手GPT-5后的“天啊时刻”:我往后靠在椅子上,感到一阵眩晕,在自己擅长的领域感到了无力。 图片最近一段时间,不论奥特曼、OpenAI官方账号还是OpenAI员工都在反复提醒大家:GPT-5很快就要发布。
7/24/2025 9:47:33 AM
四年2亿,苹果天才离职内幕首曝光!庞若鸣发离职信告别,苹果AI大溃败
天才出走,4年两亿美元! 苹果的AI宏图,彻底翻车了。 一家在七巨头中占有举足轻重地位的大厂,究竟是如何走到这一步的?
7/24/2025 9:12:00 AM
官方揭秘ChatGPT Agent背后原理!通过强化学习让模型自主探索最佳工具组合
ChatGPT Agent的技术内幕,被官方披露了。 就在OpenAI官方推出其最强智能体后,外界褒与贬的热议都没停过……但不论如何,都被视为智能体方向上标志性的一步,是OpenAI一个全新的开端。 关于更进一步的Agent Mode的工作原理,OpenAI开发团队在和投资方红杉资本的圆桌谈话中做了详细解析,还回答了几个值得关注的问题。
7/24/2025 9:05:00 AM
李沐B站更新了!教你手搓语音大模型,代码全开源还能在线试玩
这一天,辣个男人终于回想起……他的小破站账号! (活久见)李沐老师终于带着他的手搓语音大模型教程回归了….本期视频不讲论文,李沐老师来手把手教大家怎样玩转他们团队最新研发的Higgs Audio V2模型,不仅能处理文本,还能同时理解并生成语音。 除了一些常规语音任务外,这个模型还具备一些较为罕见的能力,比如生成多种语言的自然多说话人对话、旁白过程中的自动韵律调整、使用克隆声音进行旋律哼唱以及同时生成语音和背景音乐。
7/24/2025 8:55:00 AM
诱导大模型 | 新型“回音室”攻击和对抗技术
回音室攻击介绍“回音室攻击”(Echo Chamber)的新型越狱方法,可诱骗几乎所有主流大语言模型生成不良内容,Neural Trust 研究员Ahmad Alobaid在一份报告中指出:“与依赖对抗性提示或字符混淆的传统越狱方法不同,回音室攻击利用间接引用、语义引导和多步推理进行攻击”。 虽然当今主流大模型已经逐步采用各种防护措施来对抗快速注入和越狱攻击,但是“回音室攻击”都能有效的让大模型产生有害的内容,比如,色情、恐怖暴力和歧视等内容。 流程图报告的文章给出了攻击的流程图,包括六个大步骤,其中第六部是一个循环。
7/24/2025 1:00:00 AM
火山引擎云安全
“思维链”窗口正在关闭!OpenAI、谷歌、Anthropic联合研究:我们正在失去理解 AI 的能力
来自OpenAI、谷歌DeepMind和Anthropic的顶尖科学家们罕见地发出联合警告,指出人类可能正在迅速失去理解人工智能内部决策过程的能力。 图片地址:,集结了超过四十位来自这些相互竞争的科技巨头的研究人员,共同揭示了一个严峻的现实。 他们认为,一个能够让我们监视人工智能推理过程的短暂窗口正在关闭,而且可能永远不会再打开。
7/23/2025 2:22:01 PM
Cursor 新定价方案引发用户强烈不满
最近,Cursor 的开发商 nysphere 推出了每月 200 美元的高端订阅计划,但这不仅仅是新增了昂贵套餐,还在悄悄削弱了现有的 Pro 计划。 曾经承诺的 500 次请求保障,如今被标榜为“无限请求”却伴随着随意的限流规则。 据 Cursor 用户反馈,新推出的 “Ultra” 计划提供了比 20 美元的 Pro 方案高 20 倍的 AI 模型使用额度,但 Pro 用户的体验却大打折扣,甚至被描述为“完全无法生成内容”。
7/22/2025 12:58:26 PM
前端小智
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
马斯克
AI创作
智能体
英伟达
Anthropic
论文
代码
AI新词
训练
算法
Stable Diffusion
芯片
LLM
蛋白质
开发者
腾讯
Claude
苹果
生成式
AI for Science
Agent
神经网络
3D
机器学习
研究
xAI
生成
人形机器人
AI视频
计算
百度
Sora
GPU
AI设计
华为
工具
大语言模型
RAG
搜索
具身智能
字节跳动
大型语言模型
场景
深度学习
预测
视频生成
伟达
视觉
Transformer
AGI
架构
亚马逊
神器推荐
Copilot
DeepMind
特斯拉
应用