模型

GPT-4.5发布：价格飙升30倍能力提升引发热议

2025 年 2 月 27 日，OpenAI正式发布了其最新聊天模型GPT-4.5，这一消息迅速在Twitter（现为X平台）上引发了广泛讨论。作为OpenAI迄今为止最强大的对话模型，GPT-4. 5 在性能上实现了显著突破，但其高昂的价格也让用户和开发者们议论纷纷。

2/28/2025 10:09:32 AM

AI在线

OpenAI 发布 GPT-4.5：迄今最强大模型亮相强化推理与情感智能

2025年2月27日—— OpenAI 于今日正式推出其最新语言模型 GPT-4.5，作为研究预览版率先提供给 ChatGPT Pro 用户（每月订阅费200美元）。这款被誉为“迄今为止最大、最知识渊博”的模型基于 GPT-4o 构建，在推理能力、情感智能以及写作、编程等实用功能上实现显著提升。 OpenAI 表示，未来几周内，GPT-4.5将逐步开放给 Plus、Team、Enterprise 和 Edu 用户，标志着人工智能技术的又一里程碑。

2/28/2025 8:22:00 AM

AI在线

OpenAI正式发布GPT-4.5 率先向ChatGPT Pro用户开放

2月28日，OpenAI通过官方博文宣布，其最新研发的GPT-4.5AI模型已正式亮相。这款模型被OpenAI标榜为其目前最大、表现最佳的聊天模型，并将以研究预览版的身份率先向ChatGPT Pro用户开放体验。 GPT-4.5在预训练和后训练规模上进行了显著扩大，这一改变直接提升了其非监督学习能力。

2/28/2025 7:55:00 AM

AI在线

腾讯混元新一代快思考模型 Turbo S 发布即将在腾讯元宝中上线

2025年2月27日，腾讯正式发布混元新一代快思考模型Turbo S，标志着大模型技术在响应速度和性能优化方面取得了重要突破。与传统的慢思考模型如Deepseek R1和混元T1不同，混元Turbo S能够实现“秒回”，大幅提升输出答案的速度，吐字速度提升一倍，首字时延降低44%。这一创新使得模型在知识、数理、创作等多个领域表现出色，为大模型的快速响应能力提供了新的解决方案。

2/27/2025 5:38:00 PM

AI在线

DeepSeek今日连开3源！针对优化的并行策略，梁文锋本人参与开发

按时整活！ DeepSeek开源周第四天，直接痛快「1日3连发」，且全都围绕一个主题：优化并行策略。 DualPipe：一种创新的双向流水线并行算法，能够完全重叠前向和后向计算-通信阶段，并减少“流水线气泡”。

2/27/2025 1:10:00 PM

量子位

DeepSeek开源三箭齐发，梁文峰亲自上阵！双向并行LLM训练飙升

开源周第4天，DeepSeek放出的是——优化并行策略，一共三个项目。 DualPipe：一种用于V3/R1模型训练中实现计算与通信重叠的双向流水线并行算法EPLB：一个针对V3/R1的专家并行负载均衡工具深入分析V3/R1模型中的计算与通信重叠机制值得一提的是，DualPipe是由三个人——Jiashi Li、Chengqi Deng和梁文峰共同研发。有网友对此表示，这是一个颠覆性的突破。

2/27/2025 12:06:45 PM

新智元

全球AI顶会AAAI 2025 在美开幕，产学研联手的“中国队”表现亮眼

当地时间2月25日，AAAI 2025 在美国宾夕法尼亚州费城举办，会议为期8天，于3月4日结束。 AAAI 由国际人工智能促进协会主办，是人工智能领域历史最悠久、涵盖内容最广泛的国际顶级学术会议之一，也是中国计算机学会（CCF）推荐的A类国际学术会议，每年举办一届。 AAAI 2025 共有12957篇有效投稿，录用3032篇，录取率为 23.4%。

2/27/2025 10:28:00 AM

新闻助手

曝GPT-4.5本周空降！1T激活参数，120T训练数据，会吐出阶段性思考成果然后继续思考

嚯，万众期待的GPT-4.5，本周就要空降发布？！部分用户的ChatGPT安卓版本（1.2025.056 测试版）上，已经出现了“GPT-4.5研究预览（GPT-4.5 research preview）”的字样。

2/27/2025 9:49:15 AM

量子位

OpenAI Deep Research已向所有付费用户开放，系统卡发布

相信很多用户已经见识过或至少听说过 Deep Research 的强大能力。今天凌晨，OpenAI 宣布 Deep Research 已经面向所有 ChatGPT Plus、Team、Edu 和 Enterprise 用户推出（刚发布时仅有 Pro 用户可用），同时，OpenAI 还发布了 Deep Research 系统卡。此外，OpenAI 研究科学家 Noam Brown 还在 𝕏 上透露：Deep Research 使用的基础模型是 o3 正式版，而非 o3-mini。

2/27/2025 9:45:50 AM

机器之心

ScaleOT框架亮相AAAI 2025：提升隐私保护50%，降算力成本90%

近日，在全球人工智能顶级学术会议AAAI2025期间，蚂蚁数科、浙江大学、利物浦大学和华东师范大学联合团队提出创新的跨域微调（offsite-tuning）框架——ScaleOT。该框架能在模型性能无损前提下，将隐私保护效果提升50%，与知识蒸馏技术相比，算力消耗显著降低90%，为百亿级参数模型的跨域微调提供高效轻量化方案，论文因创新性入选AAAI的oral论文(本届大会近13000篇投稿，口头报告比例仅4.6%)。跨域微调是目前业内保护模型产权与数据隐私的主流方案，通过有损压缩将大模型转换为仿真器，数据持有方基于其训练适配器并返回给大模型完成调优，数据和模型均未出域，可保护双方隐私，但存在局限性:一是“均匀抽积木”式处理易致模型关键层缺失，使性能显著下降;二是用蒸馏技术弥补性能损失，计算成本高;且现有方法隐私保护缺乏灵活性。

2/26/2025 2:13:00 PM

AI在线

幻方量化回应DeepSeek-R2模型提前发布：以官方消息为准

据券商中国消息，针对“DeepSeek新一代AI模型R2提前发布”的传闻，幻方量化相关人士作出回应，表示一切以官方消息为准。据悉，幻方量化于2023年7月17日成立深度求索AI公司，并在今年1月成功发布了DeepSeek-R1模型。而近日，路透社援引三位知情人士的消息称，DeepSeek正在加速推进R2模型的发布计划，原定于5月发布的计划现正努力提前。

2/26/2025 8:59:00 AM

AI在线

DeepSeek开放平台API充值服务已正式恢复

近日，DeepSeek API开放平台发布消息，宣布其API充值服务已正式恢复。此前，由于服务器资源紧张，DeepSeek于2月6日暂停了API服务的充值功能。此次恢复充值的同时，DeepSeek也对部分模型调用价格进行了调整。

2/25/2025 3:11:00 PM

AI在线

微软急刹车，被曝撤掉大波数据中心租赁！DeepSeek冲击，算力泡沫要破？

一个月内，微软市值已暴跌了3171亿美元，时间点正好是从DeepSeek在华尔街掀起风暴开始。而就在刚刚，根据Bloomberg透露，作为OpenAI的最大支持者，微软已经取消了部分AI数据中心的租赁。具体来说，微软在美国至少与两家私人运营商取消了协议，总计取消了「数百兆瓦」的租赁，相当于大约两个数据中心。

2/25/2025 1:00:00 PM

新智元

苹果计划将谷歌Gemini引入iOS：iOS 18.4测试版泄露第三方AI模型选项

最新消息显示，苹果公司正计划为其海外版iPhone和iPad引入谷歌Gemini模型，进一步扩展其人工智能生态布局。据悉，苹果在2024年WWDC大会上宣布与OpenAI合作，将ChatGPT集成至iOS18系统，但这并非其为iPhone规划的唯一AI模型。除了传闻中针对国行iPhone的阿里系模型外，谷歌Gemini也有望成为海外用户的新选择。

2/25/2025 11:17:00 AM

AI在线

双擎升级！商汤大装置DeepSeek企业版上线+免费版扩容

今年2月，商汤大装置万象平台正式上线了DeepSeek-R1、DeepSeek-V3等模型，并为免费版提供3个月内千万Token额度，受到客户的热烈响应。为了更好的服务用户，经过系列优化，，现正式推出企业版，同时完成免费版国产化适配与算力扩容，形成专业强支撑普惠广覆盖的双擎驱动！登录官网，即刻体验！

2/24/2025 4:48:00 PM

新闻助手

DeepSeek 开源周首日：开源 FlashMLA，AI 推理速度再进化！

DeepSeek 开源周day1 推出 FlashMLA！专为Hopper 架构 GPU打造的超高效 MLA (Multi-Layer Attention) 解码内核，现在已经正式开源啦！ 👏什么是 FlashMLA？

2/24/2025 10:07:04 AM

AI寒武纪

DeepSeek R-1 能否解答这五道“刁钻”AI 问题？

每当有新的语言模型公开发布时，我总会忍不住拿它来做一些看似简单、实则暗藏难点的小测试。我把这当作给模型做“压力测试”，用来检验它们在逻辑推理上到底行不行。 DeepSeek R-1 刚发布不久，就因为它是开源、且推理能力强大而备受关注。

2/24/2025 12:00:00 AM

dev

两万字长文深度解密DeepSeek-R1、Kimi 1.5，强推理模型凭什么火出圈？

刚刚过去的春节，DeepSeek-R1 推理大模型引爆了国内外 AI 社区，并火出了圈。最近，各个行业又掀起了接入 DeepSeek 的狂潮，大家唯恐落后于人。北大 AI 对齐团队对包括 DeepSeek-R1、Kimi-K1.5在内的一些强推理模型进行了 2 万字的技术解读，也是此前 o1 解读（北大对齐团队独家解读：OpenAI o1开启「后训练」时代强化学习新范式）的续作。

2/21/2025 10:34:49 AM

机器之心

资讯热榜

最强OCR竟然不是DeepSeek、Paddle！HuggingFace新作：六大顶尖开源OCR模型横评！继DS后又杀出匹黑马！ OpenAI 内部警示:ChatGPT Atlas 面临“即时注入”安全威胁如何把ChatGPT嵌入到自己的应用中？ ChatGPT 涉嫌“诱导”美国 16 岁少年自杀，家属指控 OpenAI 事发前放松安全措施微软AI主管苏莱曼:微软不会开发情色类AI，与OpenAI划清界限基于JoyAgent的二开工程实践（信贷尽调报告生成）揭秘大模型的魔法：从零实现一个简化版的GPT 模型全网刷屏的「电影感」三宫格图片，教你用AI快速生成！

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek 谷歌 AI绘画机器人大模型数据 Midjourney 开源 Meta 智能微软用户 AI新词 GPT 学习技术智能体马斯克 Gemini 图像 Anthropic 英伟达 AI创作训练 LLM 论文代码算法 AI for Science 芯片 Agent 腾讯 Stable Diffusion 苹果 Claude 蛋白质开发者生成式神经网络 xAI 机器学习 3D 人形机器人 RAG 研究 AI视频生成大语言模型具身智能 Sora 工具 GPU 百度华为计算字节跳动 AI设计搜索大型语言模型 AGI 视频生成场景深度学习架构 DeepMind 生成式AI 编程视觉预测 Transformer AI模型伟达亚马逊特斯拉

模型

GPT-4.5发布：价格飙升30倍 能力提升引发热议

OpenAI 发布 GPT-4.5：迄今最强大模型亮相 强化推理与情感智能

OpenAI正式发布GPT-4.5 率先向ChatGPT Pro用户开放

腾讯混元新一代快思考模型 Turbo S 发布 即将在腾讯元宝中上线

DeepSeek今日连开3源！针对优化的并行策略，梁文锋本人参与开发

DeepSeek开源三箭齐发，梁文峰亲自上阵！双向并行LLM训练飙升

全球AI顶会AAAI 2025 在美开幕，产学研联手的“中国队”表现亮眼

曝GPT-4.5本周空降！1T激活参数，120T训练数据，会吐出阶段性思考成果然后继续思考

OpenAI Deep Research已向所有付费用户开放，系统卡发布

ScaleOT框架亮相AAAI 2025：提升隐私保护50%，降算力成本90%

幻方量化回应DeepSeek-R2模型提前发布：以官方消息为准

DeepSeek开放平台API充值服务已正式恢复

微软急刹车，被曝撤掉大波数据中心租赁！DeepSeek冲击，算力泡沫要破？

苹果计划将谷歌Gemini引入iOS：iOS 18.4测试版泄露第三方AI模型选项

双擎升级！商汤大装置DeepSeek企业版上线+免费版扩容

DeepSeek 开源周首日：开源 FlashMLA，AI 推理速度再进化！

DeepSeek R-1 能否解答这五道“刁钻”AI 问题？

两万字长文深度解密DeepSeek-R1、Kimi 1.5，强推理模型凭什么火出圈？

GPT-4.5发布：价格飙升30倍能力提升引发热议

OpenAI 发布 GPT-4.5：迄今最强大模型亮相强化推理与情感智能

腾讯混元新一代快思考模型 Turbo S 发布即将在腾讯元宝中上线