AIGC宇宙 AIGC宇宙

AI

​OpenAI同意以30亿美元收购AI编码助Windsurf

据彭博社报道,OpenAI 已同意以约30亿美元的价格收购人工智能编码助手 Windsurf。 这一消息是在几周的谈判后传出的,标志着 OpenAI 迄今为止最大的一笔收购。 Windsurf 之前被称为 Codeium,目前该交易尚未正式完成。
5/6/2025 10:01:27 AM
AI在线

OpenAI宣布放弃营利转型,致力于让 AGI 造福全人类

在成立十年之际,OpenAI 宣布了一项重大组织结构调整,旨在让通用人工智能(AGI)真正服务于全人类。 创始人 Sam Altman 及其团队决定将公司的营利部分转型为 “公共利益公司”(PBC),这意味着公司将更加注重公共利益而非仅仅追求利润。 这一转变的核心理念依然是让 AGI 成为人类历史上最强大的工具,帮助每一个人创造价值。
5/6/2025 10:01:12 AM
AI在线

谷歌DeepMind:大模型也很任性,知道最优路径偏要撞南墙

大语言模型(LLMs)的成功激发了人们对各种智能体的兴趣。 将 LLM 用于智能体的一个关键假设是,LLMs 利用常识和思维链(Chain-of-Thought, CoT)进行推理,从而智能体可以有效地探索并高效地解决复杂领域的问题。 然而,LLM 智能体存在次优探索和知 - 行差距(knowing-doing gap)的问题,即无法有效地将模型中的知识转化为行动。
5/6/2025 9:08:00 AM
机器之心

DeepSeek开源的文件系统,是如何提升大模型效率的?

在 AI 领域里,大模型通常具有百亿甚至数千亿参数,训练和推理过程对计算资源、存储系统和数据访问效率提出了极高要求。 2 月 28 日,DeepSeek 开源了一种高性能分布式文件系统 3FS,官方表示其目的是解决人工智能训练和推理工作负载的挑战。 作为一种并行文件系统,3FS 可以在 180 节点集群中实现 6.6 TiB/s 的聚合读取吞吐量,对于提高 DeepSeek V3、R1 大模型的训练数据预处理、数据集加载、检查点保存/重新加载、嵌入向量搜索和 KVCache 查找等工作的效率有重要帮助。
5/6/2025 9:03:00 AM
机器之心

DeepSeek还没登场,Qwen3 已经抢先引爆AI开源圈

AI 社区原本期盼 DeepSeek 发布重磅新品,却意外迎来了另一款令人瞩目的中国开源模型:Qwen3 正式登场。 此次发布的旗舰型号为 Qwen3-235B-A22B。 其中,235B 代表总参数量;而 A22B 指的是该模型采用了“专家混合”(Mixture of Experts,简称 MoE)架构,实际在每次查询中激活的参数量仅约为 220亿(22B)。
5/6/2025 12:35:33 AM
前端小智

让GPT-4.1「头皮发麻的考试」!OpenAI给大模型上强度,AI能赢吗?

雕塑在大理石块中已经完成,甚至在我开始工作之前就已经存在。 它就在那里,我只需要凿去多余的材料。 ——米开朗基罗当被问及是如何创作出如此美丽的雕塑时,米开朗基罗说「雕塑已经存在,我只是需要凿去多余的材料」。
5/6/2025 12:22:00 AM
新智元

谷歌 Gemini AI 酝酿新高级订阅层级,Ultra 蓄势待发

科技媒体 testingcatalog 今天(5 月 1 日)发布博文,报道称谷歌计划扩展 Gemini AI 服务,可能扩展推出“Gemini Ultra”订阅层级。
5/1/2025 10:40:36 AM
故渊

DeepSeek-Prover-V2 登场:AI 数学推理新王者,88.9% 通过率设新标杆

深度求索(DeepSeek)昨日(4 月 30 日)在 AI 开源社区 Hugging Face 上,发布名为 DeepSeek-Prover-V2-671B 的新模型,随后在 GitHub 等平台上公布了论文信息。
5/1/2025 9:14:27 AM
故渊

DeepSeek-Prover-V2-671B 模型开源,数学推理领域迎来新突破

中国 AI 初创公司 DeepSeek 再次掀起开源 AI 领域的热潮,正式发布其最新开源模型 DeepSeek-Prover-V2-671B。 这一拥有6710亿参数的超大规模语言模型,专为数学推理和问题解决设计,展现了 DeepSeek 在高效 AI 开发上的持续创新能力。 根据社交媒体上的最新讨论,这一模型被认为是 DeepSeek 在数学领域的重要里程碑,或将推动全球 AI 研究与应用的进一步发展。
4/30/2025 6:00:51 PM
AI在线

快手All in AI视觉!成立可灵AI事业部,加速大模型商业化

4 月 30 日,快手发布组织架构调整公告,宣布正式成立可灵AI事业部,进一步强化其在人工智能领域的战略布局。 公告显示,新成立的可灵AI事业部下设可灵AI产品部、运营部和技术部,全面负责包括可灵、可图在内的系列大模型业务。 快手高级副总裁盖坤将出任可灵AI事业部负责人,并继续兼任社区科学线负责人。
4/30/2025 6:00:51 PM
AI在线

Meta AI 独立App炸场上线!小扎力挺开源:与 DeepSeek、Qwen 一起对抗“闭源”AI

Meta又搞了个大活。 就在LlamaCon开发者大会上,这家社交巨头一口气发布了Meta AI独立App和Llama 云 API,正式把自家的AI推到了“社交 个性化 开放生态”的新维度。 图片是的,你没看错——继在WhatsApp、Instagram、Facebook、Messenger里塞满AI助手之后,Meta终于把AI单独做成了App,直接对标ChatGPT。
4/30/2025 2:12:36 PM
文摘菌

真假难辨!腾讯混元Turbo S助《太空杀》AI玩家智商飙升

社交推理游戏《太空杀》正迎来一场人和AI推理水平的大PK。 巨人网络旗下这款风靡全球的手游,通过接入腾讯混元新一代旗舰快思考模型Turbo S,使其AI玩家的智能水平实现了高度拟人化。 腾讯混元Turbo S能够同时驱动八名AI玩家参与游戏,凭借其强大的推理能力和仿真的文字对话能力,与真人玩家展开智力较量。
4/30/2025 2:00:41 PM
AI在线

​Meta 召开首届 LlamaCon 大会,意在对抗 OpenAI

Meta 在其位于加州门洛帕克的总部举行了首届人工智能开发者大会 ——LlamaCon。 在此次大会上,Meta 推出了一款面向消费者的 AI 聊天机器人应用程序,并发布了一个开发者 API,允许用户在云端访问 Llama 模型。 这些新产品旨在扩大 Meta 开源 Llama AI 模型的采用率,但实际上,Meta 的真正动机可能是超越 OpenAI。
4/30/2025 11:00:50 AM
AI在线

加速追赶!腾讯拆分AI团队,豪掷研发资源

据央广网消息,4月29日,公司对其混元大模型研发体系进行全面重构,聚焦算力、算法和数据三大核心,调整团队部署并加大研发投入。 此次调整的核心是成立两个新的部门:大语言模型部和多模态模型部,分别负责探索前沿技术、迭代基础模型。 同时,腾讯加强了底层支撑,设立数据平台部和机器学习平台部,专注于数据管理和AI平台建设,为混元大模型的研发提供全面支持。
4/30/2025 11:00:50 AM
AI在线

Qwen3来了!新一代高性能与混合推理能力兼备的大语言模型!

阿里云正式发布通义千问Qwen3系列大模型,这一里程碑式更新在性能、训练规模和推理能力等多个维度实现重大突破。 作为国产大模型的领军者,Qwen3不仅以2350亿参数的MoE架构刷新性能记录,更通过创新的"混合思考模式"和360万亿token的超大规模训练,成为当前性能领先的开源大语言模型。 1、Qwen3的性能表现Qwen3系列包含多个版本,涵盖MoE混合专家模型和Dense稠密模型。
4/30/2025 10:59:04 AM

Meta Llama AI模型下载量突破12亿,开发者热情高涨

在人工智能领域,Meta 公司近期传来了一个令人振奋的消息:其 “开放式” AI 模型系列 Llama 的下载量已突破12亿次。 这个数字在不久前的3月中旬刚刚达到10亿次,显示出 Llama 模型在开发者和用户中获得的广泛认可和热情。 在首届 LlamaCon 开发者大会上,Meta 的首席产品官 Chris Cox 在主题演讲中透露了这一令人瞩目的数据。
4/30/2025 10:00:55 AM
AI在线

万兴科技与华为云携手推进 AI 大模型技术创新

近日,万兴科技集团股份有限公司(以下简称 “万兴科技”)与华为云计算技术有限公司(以下简称 “华为云”)在深圳签署了战略合作协议。 此次合作旨在结合双方的优势,共同推动 AI 大模型的技术和应用创新,进一步开拓数字创意领域的潜力。 根据协议,万兴科技将充分发挥其在音视频大模型和 AI 应用方面的专业能力,而华为云则将利用其强大的云基础设施和市场拓展优势,建立深度合作关系。
4/30/2025 10:00:50 AM
AI在线

AI知识库的真相,你知道吗?

很多人对AI知识库的想象是这样的,他们以为只需将所有资料一股脑地拖进AI客户端,比如 Cherry Studio 内。 图片这样,AI就会认真阅读所有内容,并自动生成完美结论。 然而,实际体验后,许多人发现AI知识库的效果远没有想象中理想,经常遇到各种奇怪的问题。
4/30/2025 9:06:23 AM
程序员NEO