文章列表
陈丹琦团队降本大法又来了:数据砍掉三分之一,性能却完全不减
陈丹琦团队又带着他们的降本大法来了——数据砍掉三分之一,大模型性能却完全不减。 他们引入了元数据,加速了大模型预训练的同时,也不增加单独的计算开销。 在不同模型规模(600M - 8B)和训练数据来源的情况下,均能实现性能方面的提升。
1/7/2025 12:55:00 PM
量子位
实时高保真人脸编辑方法PersonaMagic,可根据肖像无缝生成新角色、风格或场景图像。
本文经AIGC Studio公众号授权转载,转载请联系出处。 今天给大家介绍的是一个高保真实时人脸编辑方法PersonaMagic,通过分阶段的文本条件调节和动态嵌入学习来优化人脸定制。 该技术利用时序动态的交叉注意力机制,能够在不同阶段有效捕捉人脸特征,从而在生成个性化图像时最大程度地保留身份信息。
1/7/2025 9:20:00 AM
Xinzhe Li等
AI应用实战!如何用Midjourney生成完整的故事配图?
本文从分镜设计、故事场景、合成调整3个方面,聊聊如何生成完整的故事配图。 往期MJ干货:. Midjourney 重磅更新!
1/7/2025 12:20:12 AM
京东JellyDesign 团队
AAAI 2025 | IML领域稀疏化视觉Transformer,代码已开源
SparseViT 的主要科研成员来自四川大学吕建成团队,合作方为澳门大学潘治文教授团队。 论文:《Can We Get Rid of Handcrafted Feature Extractors? SparseViT: Nonsemantics-Centered, Parameter-Efficient Image Manipulation Localization through Spare-Coding Transformer》论文链接::,图像处理变得非常方便。
1/7/2025 12:00:00 AM
机器之心
OpenAI 阿尔特曼:使用次数远超预期,Pro 高级订阅正处于亏损状态
山姆・阿尔特曼表示,ChatGPT Pro 的订阅价格是他个人选择的,本以为会在这种定价下实现一定盈利。
1/6/2025 2:42:38 PM
溯波(实习)
阿尔特曼称 OpenAI 目标开始转向“超级智能”:有望大幅提升财富和繁荣
OpenAI首席执行官萨姆·阿尔特曼表示,他相信OpenAI“知道如何构建人工通用智能”(AGI),即按照传统定义的AGI,并且已经开始将目标转向“超级智能”。
1/6/2025 1:40:05 PM
清源
奥特曼疯狂发推:AGI将至!2025年,第一批智能体成为公司劳动力;回顾OpenAI九年:我们的愿景不会改变,但策略将继续演变!
出品 | 51CTO技术栈(微信号:blog51cto)OpenAI CEO,营销高手,奥特曼又开始疯狂发推了。 首先,他又充当起了AI“谜语人”,给观众一些模棱两可的话。 “接近奇点;不清楚是哪一边”。
1/6/2025 1:30:45 PM
刚刚,奥特曼发长文「反思」:十年艰难创业路,如今已掌握AGI秘诀
就在刚刚,奥特曼发出了一篇长文博客,名为「反思」。 这篇博客发得很应景。 就在前不久,奥特曼刚刚接受了彭博社的专访,曝出了不少猛料,包括对OpenAI前董事会的态度、与马斯克的恩怨,以及对川普时代AI走向的看法。
1/6/2025 12:58:49 PM
新智元
奥特曼回应一切:宫斗、马斯克、ChatGPT两周年
2022 年 11 月 30 日,OpenAI 的网站访问量达到了一个从未有过的峰值。 当时,这家初创公司虽然在业内赫赫有名,但远没摸到大厂门槛,以至于其所有者甚至没有费心去追踪他们的网络流量。 不过今天看来,那是这个公司最后一个「平静」的日子。
1/6/2025 12:55:00 PM
机器之心
仅需一万块钱!清华团队靠强化学习让 7B模型数学打败GPT-4o
OpenAI o1和o3模型的发布证明了强化学习能够让大模型拥有像人一样的快速迭代试错、深度思考的高阶推理能力,在基于模仿学习的Scaling Law逐渐受到质疑的今天,基于探索的强化学习有望带来新的Scaling Law。 近日,清华大学NLP实验室、上海AI Lab、清华大学电子系、OpenBMB社区等团队提出一种新的结合过程奖励的强化学习方法——PRIME(Process Reinforcement through IMplicit REwards)。 采用PRIME方法,研究人员不依赖任何蒸馏数据和模仿学习,仅用8张A100,花费一万块钱左右,不到10天时间,就能高效训练出一个数学能力超过 GPT-4o、Llama-3.1-70B的7B模型 Eurus-2-7B-PRIME。
1/6/2025 12:46:16 PM
量子位
刚刚,奥特曼更新博客:创业第十年,我的反思
山姆・奥特曼开始反思了。 2025 年到来还不到 1 周时间,在刚刚接受了彭博社专访之后不久,这位著名却又备受争议的 CEO 又发布了一篇题为「反思」的博客文章;其中回顾了 ChatGPT 的发展历程,并尤其强调了 OpenAI 创立以来他们面临的各种「冲突和误解」。 他表示,之前的解雇事件是善良的人进行治理的一个巨大失败(a big failure of governance by well-meaning people)。
1/6/2025 11:13:00 AM
机器之心
「停止雇佣人类」广告牌爆火,OpenAI放惊人言论:每月2000刀,AI淘汰人类!
随着人工智能的日益强大,最令人担心的事情终于还是发生了。 旧金山一家科技公司已经开始明目张胆地宣布「停止雇佣人类」! 就在旧金山密西西比街的一侧,一些酒店从业者为了争取更高待遇与更多工作机会的罢工运动已经持续了数月。
1/6/2025 10:23:00 AM
新智元
全网都在扒的DeepSeek团队,是清北应届生撑起一片天
DeepSeek-v3大模型横空出世,以1/11算力训练出超过Llama 3的开源模型,震撼了整个AI圈。 紧接着,“雷军开千万年薪挖DeepSeek研究员罗福莉”的传闻,也使得人们把目光聚焦向DeepSeek的人才。 这下不只科技圈,全网都在好奇,连小红书上都有人发帖询问,这究竟是一只怎样的团队?
1/6/2025 7:45:00 AM
趋势抢先知!14个值得关注的最新设计资讯
更多新鲜工具:. 第二波! 2024年12月精选实用设计工具合集大家好,这是 2024 年 12 月的第 2 波干货合集!
1/6/2025 12:41:16 AM
ISUX 团队
Just keep scaling!思维链作者Jason Wei 40分钟讲座剖析LLM扩展范式
关注 AI 领域的人对 Jason Wei 这个名字一定不陌生。 他是 OpenAI 的一位资深研究科学家,也常在 OpenAI 的发布活动中露脸。 更重要的是,他是思维链概念开山之作《Chain-of-Thought Prompting Elicits Reasoning in Large Language Models》的第一作者。
1/4/2025 5:50:00 PM
机器之心
从DeepSeek-V3发布谈大模型的技术突破与未来机遇
在AI技术日新月异的今天,大型语言模型已成为推动AI发展的重要力量。 2024年12月26日,DeepSeek AI正式发布了其最新的大型语言模型——DeepSeek-V3。 这款开源模型采用了高达6710亿参数的混合专家(MoE)架构,每秒能够处理60个token,比V2快了3倍。
1/3/2025 7:38:33 PM
张诚