大模型
陈丹琦团队降本大法又来了:数据砍掉三分之一,性能却完全不减
陈丹琦团队又带着他们的降本大法来了——数据砍掉三分之一,大模型性能却完全不减。 他们引入了元数据,加速了大模型预训练的同时,也不增加单独的计算开销。 在不同模型规模(600M - 8B)和训练数据来源的情况下,均能实现性能方面的提升。
1/7/2025 12:55:00 PM
量子位
实时高保真人脸编辑方法PersonaMagic,可根据肖像无缝生成新角色、风格或场景图像。
本文经AIGC Studio公众号授权转载,转载请联系出处。 今天给大家介绍的是一个高保真实时人脸编辑方法PersonaMagic,通过分阶段的文本条件调节和动态嵌入学习来优化人脸定制。 该技术利用时序动态的交叉注意力机制,能够在不同阶段有效捕捉人脸特征,从而在生成个性化图像时最大程度地保留身份信息。
1/7/2025 9:20:00 AM
Xinzhe Li等
AAAI 2025 | IML领域稀疏化视觉Transformer,代码已开源
SparseViT 的主要科研成员来自四川大学吕建成团队,合作方为澳门大学潘治文教授团队。 论文:《Can We Get Rid of Handcrafted Feature Extractors? SparseViT: Nonsemantics-Centered, Parameter-Efficient Image Manipulation Localization through Spare-Coding Transformer》论文链接::,图像处理变得非常方便。
1/7/2025 12:00:00 AM
机器之心
仅需一万块钱!清华团队靠强化学习让 7B模型数学打败GPT-4o
OpenAI o1和o3模型的发布证明了强化学习能够让大模型拥有像人一样的快速迭代试错、深度思考的高阶推理能力,在基于模仿学习的Scaling Law逐渐受到质疑的今天,基于探索的强化学习有望带来新的Scaling Law。 近日,清华大学NLP实验室、上海AI Lab、清华大学电子系、OpenBMB社区等团队提出一种新的结合过程奖励的强化学习方法——PRIME(Process Reinforcement through IMplicit REwards)。 采用PRIME方法,研究人员不依赖任何蒸馏数据和模仿学习,仅用8张A100,花费一万块钱左右,不到10天时间,就能高效训练出一个数学能力超过 GPT-4o、Llama-3.1-70B的7B模型 Eurus-2-7B-PRIME。
1/6/2025 12:46:16 PM
量子位
「停止雇佣人类」广告牌爆火,OpenAI放惊人言论:每月2000刀,AI淘汰人类!
随着人工智能的日益强大,最令人担心的事情终于还是发生了。 旧金山一家科技公司已经开始明目张胆地宣布「停止雇佣人类」! 就在旧金山密西西比街的一侧,一些酒店从业者为了争取更高待遇与更多工作机会的罢工运动已经持续了数月。
1/6/2025 10:23:00 AM
新智元
全网都在扒的DeepSeek团队,是清北应届生撑起一片天
DeepSeek-v3大模型横空出世,以1/11算力训练出超过Llama 3的开源模型,震撼了整个AI圈。 紧接着,“雷军开千万年薪挖DeepSeek研究员罗福莉”的传闻,也使得人们把目光聚焦向DeepSeek的人才。 这下不只科技圈,全网都在好奇,连小红书上都有人发帖询问,这究竟是一只怎样的团队?
1/6/2025 7:45:00 AM
你的专属“钢铁侠”助手OS Agents来了!浙大联手OPPO、零一万物等10个机构推出全新综述
电影《钢铁侠》中,托尼·斯塔克的助手贾维斯(J.A.R.V.I.S.)能帮他控制各种系统并自动完成任务,曾让无数观众羡慕不已。 现在,这样的超级智能助手,终于变成现实了! 随着多模态大语言模型的爆发式进化,OS Agents横空出世,它们能无缝操控电脑和手机,为你自动搞定繁琐任务。
1/3/2025 3:44:09 PM
量子位
动物版谷歌翻译来了?Nature:用AI解码野性的呼唤!
每一种动物都有其独特的历史。 来自加拿大Carleton University的鲸鱼生物学家Shane Gero,花了20年时间试图了解鲸鱼是如何交流的。 比如,同一个家族的鲸鱼会发出特定的声音,而不同区域的抹香鲸(Physeter macrocephalus)有自己的「方言」。
1/3/2025 1:00:00 PM
新智元
Science子刊 | GPT4、Llama等LLM可以调节粒子加速器?仅50%性能优化,未来可期
编辑 | 萝卜皮粒子加速器的自主调节是一个活跃且具有挑战性的研究领域,其目标是实现先进的加速器技术和尖端的高影响力应用,例如物理发现、癌症研究和材料科学。 但是,自主加速器调节仍然严重依赖经验丰富的熟练操作员的手动操作。 德国亥姆霍兹协会旗下 DESY(Deutsches Elektronen Synchrotron)的研究人员建议使用大型语言模型(LLM)来调整粒子加速器。
1/3/2025 11:56:00 AM
ScienceAI
OpenAI发布新年目标,Agent智能体或将迎来百模大战
2025年1月1日,OpenAI CEO 奥特曼公布了公司的新年目标,涵盖AGI、智能体、4o升级、模型更好记忆、更长上下文等等。 图片关于智能体,有网友爆料,OpenAI 可能在 1 月份发布一个名为 “operator” 的 Agent,这个 Agent 将具备直接控制电脑的能力。 图片其实24年10月份的时候,Claude 就已经发布了基于 Claude 3.5 Sonnet 多模态大模型,可操作电脑的智能体。
1/3/2025 11:02:38 AM
渡码
阿里云与零一万物达成战略合作,成立“产业大模型联合实验室” ,加速落地应用
近期,阿里云和大模型头部企业零一万物达成模型平台业务的战略合作,双方将成立“产业大模型联合实验室”,联手加速大模型从技术到应用的落地,进一步扩大产业大模型的生态整合。 据悉,双方深度战略合作的产业大模型联合实验室包含技术、业务、人才等板块,阿里和零一万物将结合两个团队全球顶尖的大模型研发实力,形成从下一代基座模型技术探索到产业落地大模型服务的组合拳,全面通过阿里云百炼大模型平台的模型服务层面向市场,针对 ToB 行业打造更强更全面的大模型解决方案,加速大模型穿透千行百业。 在开展的合作中,阿里云拥有从技术到算力到服务层的平台级完整链条, 通义系列大模型将作为具有强大通用能力的“教师模型”,零一万物拥有国际前沿的高性价比模型能力,能够敏捷批量训练垂直定向的产业智能模型,双方联手将加速大模型的产业落地,拓宽大模型生态前景。
1/3/2025 10:32:00 AM
新闻助手
金融风控领域的大模型落地实践
Akulaku 作为一个海外互联网金融平台,运用大模型优化金融风控、客服及电商推荐等场景,通过集成图像(如 KYC 人脸识别)、文本(如智能客服)与设备数据,增强风控系统效能与用户体验。 大模型的引入旨在提升效率,通过优化小模型构建与工作流程自动化,减轻业务人员负担。 智能体在金融领域的应用包括欺诈调查与数据分析助手,预示着通过大模型辅助构建类 AGI 系统的可能性,能够进一步提升金融风控的效率与效果,在金融领域拥有广泛的应用前景。
1/3/2025 8:26:17 AM
黄泓
别再将LLM当成数据库了
译者 | 布加迪审校 | 重楼想象一下,你戴着耳机驾驶一辆汽车,每五分钟才更新一次路况信息,而不是持续不断地提供当前位置情况的视频流。 过不了多久,你就会撞车。 虽然这种类型的批处理在现实世界中并不适用,却是当今许多系统运行的方式。
1/3/2025 8:13:08 AM
布加迪
智象未来多模态大模型3.0全球首发,创始人兼CEO梅涛演讲实录来了
2024年12月28日,智象未来科技有限公司在安徽省人工智能产业先导区启动仪式中,宣布智象多模态生成大模型3.0与智象多模态理解大模型1.0同时发布。 上海电影集团、中国移动咪咕音乐、科大讯飞等企业参加。 加拿大工程院外籍院士、智象未来创始人兼CEO梅涛进行现场演讲。
1/2/2025 4:20:00 PM
新闻助手
全新模型RoboVLMs解锁VLA无限可能,真实机器人实验交出满分答卷
本文作者来自清华大学、字节跳动、中科院自动化所、上海交通大学和新加坡国立大学。 作者列表:李兴航、李沛言、刘明桓、王栋、刘济榕、康炳易、马骁、孔涛、张翰博和刘华平。 第一作者李兴航是清华大学计算机系博士生。
1/2/2025 2:30:00 PM
机器之心
多模态模型已落地多领域,OpenBayes贝式计算获评「大模型最具潜力创业企业 TOP 10」
缩放定律的放缓带来的技术路径演变在 2024 年的 NeurIPS 会议上,Ilya Sutskever 提出了一系列关于人工智能发展的挑战性观点,尤其集中于 Scaling Law 的观点:「现有的预训练方法将会结束」,这不仅是一次技术的自然演进,也可能标志着对当前「大力出奇迹」方法的根本性质疑。 Ilya 讨论了预训练模型的局限性,预见 AI 系统需要发展出更加接近人类思考方式的推理能力。 他强调,为了突破当前的局限并继续提升 AI 的能力,必须寻找新的训练方法。
1/2/2025 2:20:00 PM
机器之心
全面打破GPT-4垄断、DeepSeek打下训练成本...2024年大模型领域进展全复盘
刚刚过去的 2024 年是生成式 AI 大发展的一年,我们见证了 OpenAI Sora 的崛起,大模型服务价格的飞速下降,以及国内开源大模型的奋起直追。 这全方位的快速发展让我们对下一波 AI 的新技术大规模应用充满了信心。 对于身在 AI 领域的工程师和学者们来说,他们看待这一年的观点会有不同吗?
1/2/2025 1:15:00 PM
机器之心
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
马斯克
AI创作
智能体
论文
英伟达
Anthropic
代码
训练
算法
Stable Diffusion
芯片
蛋白质
开发者
LLM
腾讯
生成式
Claude
苹果
AI新词
Agent
神经网络
AI for Science
3D
机器学习
研究
生成
xAI
人形机器人
AI视频
计算
Sora
GPU
AI设计
百度
华为
工具
大语言模型
搜索
具身智能
场景
RAG
字节跳动
大型语言模型
深度学习
预测
伟达
视觉
Transformer
视频生成
AGI
架构
神器推荐
亚马逊
Copilot
DeepMind
应用
安全