大模型

「停止雇佣人类」广告牌爆火，OpenAI放惊人言论：每月2000刀，AI淘汰人类！

随着人工智能的日益强大，最令人担心的事情终于还是发生了。旧金山一家科技公司已经开始明目张胆地宣布「停止雇佣人类」！就在旧金山密西西比街的一侧，一些酒店从业者为了争取更高待遇与更多工作机会的罢工运动已经持续了数月。

1/6/2025 10:23:00 AM

新智元

全网都在扒的DeepSeek团队，是清北应届生撑起一片天

DeepSeek-v3大模型横空出世，以1/11算力训练出超过Llama 3的开源模型，震撼了整个AI圈。紧接着，“雷军开千万年薪挖DeepSeek研究员罗福莉”的传闻，也使得人们把目光聚焦向DeepSeek的人才。这下不只科技圈，全网都在好奇，连小红书上都有人发帖询问，这究竟是一只怎样的团队？

1/6/2025 7:45:00 AM

你的专属“钢铁侠”助手OS Agents来了！浙大联手OPPO、零一万物等10个机构推出全新综述

电影《钢铁侠》中，托尼·斯塔克的助手贾维斯（J.A.R.V.I.S.）能帮他控制各种系统并自动完成任务，曾让无数观众羡慕不已。现在，这样的超级智能助手，终于变成现实了！随着多模态大语言模型的爆发式进化，OS Agents横空出世，它们能无缝操控电脑和手机，为你自动搞定繁琐任务。

1/3/2025 3:44:09 PM

量子位

动物版谷歌翻译来了？Nature：用AI解码野性的呼唤！

每一种动物都有其独特的历史。来自加拿大Carleton University的鲸鱼生物学家Shane Gero，花了20年时间试图了解鲸鱼是如何交流的。比如，同一个家族的鲸鱼会发出特定的声音，而不同区域的抹香鲸（Physeter macrocephalus）有自己的「方言」。

1/3/2025 1:00:00 PM

新智元

Science子刊 | GPT4、Llama等LLM可以调节粒子加速器？仅50%性能优化，未来可期

编辑 | 萝卜皮粒子加速器的自主调节是一个活跃且具有挑战性的研究领域，其目标是实现先进的加速器技术和尖端的高影响力应用，例如物理发现、癌症研究和材料科学。但是，自主加速器调节仍然严重依赖经验丰富的熟练操作员的手动操作。德国亥姆霍兹协会旗下 DESY（Deutsches Elektronen Synchrotron）的研究人员建议使用大型语言模型（LLM）来调整粒子加速器。

1/3/2025 11:56:00 AM

ScienceAI

2025年1月1日，OpenAI CEO 奥特曼公布了公司的新年目标，涵盖AGI、智能体、4o升级、模型更好记忆、更长上下文等等。图片关于智能体，有网友爆料，OpenAI 可能在 1 月份发布一个名为 “operator” 的 Agent，这个 Agent 将具备直接控制电脑的能力。图片其实24年10月份的时候，Claude 就已经发布了基于 Claude 3.5 Sonnet 多模态大模型，可操作电脑的智能体。

1/3/2025 11:02:38 AM

渡码

阿里云与零一万物达成战略合作，成立“产业大模型联合实验室” ，加速落地应用

近期，阿里云和大模型头部企业零一万物达成模型平台业务的战略合作，双方将成立“产业大模型联合实验室”，联手加速大模型从技术到应用的落地，进一步扩大产业大模型的生态整合。据悉，双方深度战略合作的产业大模型联合实验室包含技术、业务、人才等板块，阿里和零一万物将结合两个团队全球顶尖的大模型研发实力，形成从下一代基座模型技术探索到产业落地大模型服务的组合拳，全面通过阿里云百炼大模型平台的模型服务层面向市场，针对 ToB 行业打造更强更全面的大模型解决方案，加速大模型穿透千行百业。在开展的合作中，阿里云拥有从技术到算力到服务层的平台级完整链条，通义系列大模型将作为具有强大通用能力的“教师模型”，零一万物拥有国际前沿的高性价比模型能力，能够敏捷批量训练垂直定向的产业智能模型，双方联手将加速大模型的产业落地，拓宽大模型生态前景。

1/3/2025 10:32:00 AM

新闻助手

金融风控领域的大模型落地实践

Akulaku 作为一个海外互联网金融平台，运用大模型优化金融风控、客服及电商推荐等场景，通过集成图像（如 KYC 人脸识别）、文本（如智能客服）与设备数据，增强风控系统效能与用户体验。大模型的引入旨在提升效率，通过优化小模型构建与工作流程自动化，减轻业务人员负担。智能体在金融领域的应用包括欺诈调查与数据分析助手，预示着通过大模型辅助构建类 AGI 系统的可能性，能够进一步提升金融风控的效率与效果，在金融领域拥有广泛的应用前景。

1/3/2025 8:26:17 AM

黄泓

别再将LLM当成数据库了

译者 | 布加迪审校 | 重楼想象一下，你戴着耳机驾驶一辆汽车，每五分钟才更新一次路况信息，而不是持续不断地提供当前位置情况的视频流。过不了多久，你就会撞车。虽然这种类型的批处理在现实世界中并不适用，却是当今许多系统运行的方式。

1/3/2025 8:13:08 AM

布加迪

智象未来多模态大模型3.0全球首发，创始人兼CEO梅涛演讲实录来了

2024年12月28日，智象未来科技有限公司在安徽省人工智能产业先导区启动仪式中，宣布智象多模态生成大模型3.0与智象多模态理解大模型1.0同时发布。上海电影集团、中国移动咪咕音乐、科大讯飞等企业参加。加拿大工程院外籍院士、智象未来创始人兼CEO梅涛进行现场演讲。

1/2/2025 4:20:00 PM

新闻助手

全新模型RoboVLMs解锁VLA无限可能，真实机器人实验交出满分答卷

本文作者来自清华大学、字节跳动、中科院自动化所、上海交通大学和新加坡国立大学。作者列表：李兴航、李沛言、刘明桓、王栋、刘济榕、康炳易、马骁、孔涛、张翰博和刘华平。第一作者李兴航是清华大学计算机系博士生。

1/2/2025 2:30:00 PM

机器之心

多模态模型已落地多领域，OpenBayes贝式计算获评「大模型最具潜力创业企业 TOP 10」

缩放定律的放缓带来的技术路径演变在 2024 年的 NeurIPS 会议上，Ilya Sutskever 提出了一系列关于人工智能发展的挑战性观点，尤其集中于 Scaling Law 的观点：「现有的预训练方法将会结束」，这不仅是一次技术的自然演进，也可能标志着对当前「大力出奇迹」方法的根本性质疑。 Ilya 讨论了预训练模型的局限性，预见 AI 系统需要发展出更加接近人类思考方式的推理能力。他强调，为了突破当前的局限并继续提升 AI 的能力，必须寻找新的训练方法。

1/2/2025 2:20:00 PM

机器之心

全面打破GPT-4垄断、DeepSeek打下训练成本...2024年大模型领域进展全复盘

刚刚过去的 2024 年是生成式 AI 大发展的一年，我们见证了 OpenAI Sora 的崛起，大模型服务价格的飞速下降，以及国内开源大模型的奋起直追。这全方位的快速发展让我们对下一波 AI 的新技术大规模应用充满了信心。对于身在 AI 领域的工程师和学者们来说，他们看待这一年的观点会有不同吗？

1/2/2025 1:15:00 PM

机器之心

微软论文意外「走光」，OpenAI参数全泄密！GPT-4o仅200B，o1 300B

谁能想到，微软在一篇医学领域的论文里，竟然把OpenAI模型的参数全「曝光」了！ GPT-4参数约1.76万亿GPT-4o参数约2000亿GPT-4o mini参数约80亿o1-preview参数约3000亿o1-mini参数约1000亿Claude 3.5 Sonnet参数约1750亿研究人员：参数均为估算值让所有人难以置信的是，GPT-4o系列的参数如此少，mini版甚至只有8B。有网友猜测，4o mini是一个大约有40B参数的MoE模型，其中激活参数为8B。

1/2/2025 1:00:00 PM

新智元

上交大揭露大模型审稿风险：一句话就能让论文评分飞升

大语言模型（LLMs）正以前所未有的方式，深刻影响着学术同行评审的格局。同行评审作为科学研究的基石，其重要性毋庸置疑。然而，随着大语言模型逐渐渗透到这一核心过程，我们是否已经准备好面对它可能带来的深远影响？

1/2/2025 7:00:00 AM

2025 年考研数学一得 126 分，智谱深度推理模型 GLM-Zero 预览版上线

GLM-Zero-Preview 是 GLM 家族中专注于增强 AI 推理能力的模型，擅长处理数理逻辑、代码和需要深度推理的复杂问题。

12/31/2024 5:53:12 PM

沛霖（实习）

黄仁勋自掏腰包50亿，开源英伟达GPU管理工具

离2025年只剩十几个小时，黄仁勋拿出50亿真金白银给大家发红包了！他刚花7亿美金（51亿RMB）收购了一家初创公司，专门做GPU管理工具的。并且立刻就宣布：开源所有平台和技术，买了英伟达GPU就能免费用。

12/31/2024 3:00:00 PM

量子位

ViT作者飞机上也要读的改进版Transformer论文，花2个小时详细批注解读分享出来

ViT核心作者Lucas Beyer，长文分析了一篇改进Transformer架构的论文，引起推荐围观。他前不久从谷歌跳槽到OpenAI，这次是在飞机上阅读论文并写下了分析。这篇论文被他简写为DiffTranformer，不过不是Sora底层架构的那个Diffusion Transformer，而是不久前来自微软的Differencial Transformer。

12/31/2024 2:30:00 PM

量子位

资讯热榜

腾讯云大模型升级公告:DeepSeek-V3/ DeepSeek-R1模型将于24日正式下线 OpenAI低调更新GPT4o模型，多项能力反超DeepSeek DeepSeek-R1 登顶 Hugging Face：以10000 赞力压 150 万个模型自有歪果仁为DeepSeek「辩经」：揭穿围绕DeepSeek的谣言 IBM 强化 watsonx.ai:DeepSeek-R1蒸馏版 Llama 模型上线东风日产N7首款接入DeepSeek大模型，实现智能化人机交互腾讯云上线DeepSeek全系API接口并打通联网搜索微信搜索接入DeepSeek大模型称AI不会使用朋友圈聊天等信息

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI绘画大模型机器人数据 AI新词 Midjourney 开源 Meta 微软智能用户 GPT 学习技术智能体 Gemini 马斯克 Anthropic 英伟达图像 AI创作训练 LLM 论文代码算法苹果 AI for Science Agent Claude 腾讯芯片 Stable Diffusion 蛋白质具身智能开发者 xAI 生成式神经网络机器学习人形机器人 3D AI视频 RAG 大语言模型研究百度 Sora 生成 GPU 工具华为字节跳动计算 AGI 大型语言模型 AI设计搜索生成式AI 视频生成 DeepMind 特斯拉场景 AI模型深度学习亚马逊架构 Transformer MCP 编程视觉预测

大模型

「停止雇佣人类」广告牌爆火，OpenAI放惊人言论：每月2000刀，AI淘汰人类！

全网都在扒的DeepSeek团队，是清北应届生撑起一片天

你的专属“钢铁侠”助手OS Agents来了！浙大联手OPPO、零一万物等10个机构推出全新综述

动物版谷歌翻译来了？Nature：用AI解码野性的呼唤！

Science子刊 | GPT4、Llama等LLM可以调节粒子加速器？仅50%性能优化，未来可期

OpenAI发布新年目标，Agent智能体或将迎来百模大战

阿里云与零一万物达成战略合作，成立“产业大模型联合实验室” ，加速落地应用

金融风控领域的大模型落地实践

别再将LLM当成数据库了

智象未来多模态大模型3.0全球首发，创始人兼CEO梅涛演讲实录来了

全新模型RoboVLMs解锁VLA无限可能，真实机器人实验交出满分答卷

多模态模型已落地多领域，OpenBayes贝式计算获评「大模型最具潜力创业企业 TOP 10」

全面打破GPT-4垄断、DeepSeek打下训练成本...2024年大模型领域进展全复盘

微软论文意外「走光」，OpenAI参数全泄密！GPT-4o仅200B，o1 300B

上交大揭露大模型审稿风险：一句话就能让论文评分飞升

2025 年考研数学一得 126 分，智谱深度推理模型 GLM-Zero 预览版上线

黄仁勋自掏腰包50亿，开源英伟达GPU管理工具

ViT作者飞机上也要读的改进版Transformer论文，花2个小时详细批注解读分享出来