理论
Copilot上大分,仅数天,陶哲轩的估计验证工具卷到2.0!刚刚又发数学形式化证明视频
本周二,我们报道了菲尔兹奖得主陶哲轩的一个开源项目 —— 在大模型的协助下编写了一个概念验证软件工具,来验证涉及任意正参数的给定估计是否成立(在常数因子范围内)。 在项目中,他开发了一个用于自动(或半自动)证明分析中估计值的框架。 估计值是 X≲Y(在渐近记法中表示 X=O (Y))或 X≪Y(在渐近符号中表示 X=o (Y))形式的不等式。
5/12/2025 9:05:00 AM
突发!OpenAI正与微软洽谈新融资,筹备IPO
昨晚,金融时报消息,OpenAI和微软正在重新洽谈数十亿美元的合作条款。 这场谈判旨在让OpenAI能够进行未来的首次公开IPO募股,同时保护微软对前沿AI的访问权限。 微软作为OpenAI最大的支持者,是其重组从非营利转向营利的关键阻碍。
5/12/2025 8:59:26 AM
OpenAI神秘项目曝光:cderGPT,用AI加速药物评估
OpenAI又一个神秘项目曝光了——名字叫做cderGPT,专门用来给药物评估这事提一提速度。 据Wired发布的消息来看,OpenAI的高层为了这个项目,已经与美国食品药品监督管理局(FDA)和马斯克的效率部门进行了多次讨论。 至于为什么要做这么个事,FDA局长Marty Makary在X上发表了他的看法:FDA现在不得不直面一些前所未有的重大问题:为什么一款新药上市要耗费十年以上的时间?
5/9/2025 8:35:00 AM
刚刚,OpenAI任命新CEO!
刚刚,OpenAI迎来新CEO。 奥特曼发文称,Fidji Simo将以「应用CEO」全新身份加入OpenAI,向他本人汇报。 图片奥特曼依旧还是OpenAI CEO,不过未来将专注于研究、算力与安全。
5/8/2025 4:40:27 PM
新智元
突发,OpenAI官宣新的CEO!奥特曼发文祝贺,新CEO来自“美国版美团”!
出品 | 51CTO技术栈(微信号:blog51cto)刚刚,OpenAI官宣了新的CEO!别急,倒不是奥特曼卸任了。 而是OpenAI开设了一个新岗位:应用首席执行官。 来自Instacart 的首席执行官 Fidji Simo 官宣将加入 OpenAI,担任应用部门的 CEO。
5/8/2025 3:42:15 PM
低价大模型 DeepSeek 实用指南
火爆全网的国产大模型 DeepSeek,其 API 价格仅为同类模型的几十分之一。 图片DeepSeek 网页端与 API 应用场景DeepSeek 网页端界面简洁直观,但 API 使用需要一定技巧。 本文将从对话、知识库、AI 翻译、AI 编程及 Python 调用等多个场景,分篇评测 DeepSeek API 的实际应用。
5/8/2025 8:10:25 AM
红绿灯灯灯灯
机器人界「Sora」来了!清华、星动纪元开源首个AIGC机器人大模型,入选ICML2025 Spotlight
从 2023 年的 Sora 到如今的可灵、Vidu、通义万相,AIGC 生成式技术的魔法席卷全球,打开了 AI 应用落地的大门。 无独有偶,AIGC 生成式技术同样在具身智能机器人大模型上带来了惊人的表现。 “给我盛一碗热腾腾的鸡汤”,以前这句话能带给你一个温暖感人、栩栩如生的视频。
5/7/2025 1:48:48 PM
机器之心
掷30亿美元,OpenAI史上最大收购案!
OpenAI史上最大一笔收购即将敲定。 彭博爆料称,OpenAI将豪掷30亿美元,吞并了爆火编码神器Windsurf(前身为Codeium)。 此前,早有外媒曝出了这笔交易,目前离最终达成接近尾声。
5/7/2025 10:09:28 AM
新智元
刚刚,Gemini 2.5 Pro升级,成编程模型新王
你的默认编程模型是什么? 或许可以换一换了。 刚刚,Google DeepMind 发布了 Gemini 2.5 Pro 的最新更新版本:Gemini 2.5 Pro (I/O edition)。
5/7/2025 10:01:35 AM
从看见到理解,多模态大模型如何重塑行为检测
在人工智能技术快速迭代的今天,行为检测作为计算机视觉领域的重要分支,正迎来一场由多模态大模型引领的技术革命。 作为曾在CV算法公司工作的从业者,我深刻体会到传统计算机视觉方法在实际落地中的诸多痛点。 过去几年,许多行为检测、烟火检测等应用,往往因为高昂的训练成本和难以接受的误报率而被甲方叫停。
5/7/2025 1:00:00 AM
贝塔街的万事屋
三分钟快速入门大模型数据工程
向自然语言处理的大模型应用,数据工程的核心任务是构建一套高效、可扩展、可控的数据流程,从源头到可用于模型训练、推理的高质量文本语料,全链路打通。 数据工程的整体目标构建稳定的数据流转链路,从原始文本数据 → 清洗/标注/审核后的语料 → 符合模型输入格式的数据集保证数据可用性、完整性、质量、结构统一性支持多阶段使用场景:训练/微调、推理RAG、评估测试等数据来源最常见的形式是甲方提供,如客户工单、业务知识库、客服聊天记录、FAQ 等。 需尽早明确数据格式、内容范围、隐私边界。
5/7/2025 12:10:00 AM
贝塔街的万事屋
OpenAI转型计划遇阻:继续由非营利实体控制,重组方案被迫调整
当地时间5月5日,人工智能研究公司OpenAI宣布,其转型计划遭遇重大调整,将继续由其非营利性母公司控制,同时推进营利性部门的结构调整,以在激烈的AI竞赛中筹集更多资金并保持领先地位。 去年12月,OpenAI公布了一项重组计划,拟转型为一家公益企业(Public Benefit Corporation,简称PBC),称这将有助于吸引更多投资,并摆脱现行非营利架构带来的限制。 然而,这一计划却遭到了外界的猛烈批评及法律挑战,甚至引发了世界首富埃隆·马斯克的诉讼。
5/6/2025 3:48:25 PM
刚刚,OpenAI公司结构重大调整:继续由非营利实体控制,营利性部门要变公益公司
OpenAI的公司结构,终于是尘埃落定了。 就在刚刚,OpenAI官方重磅宣布:将继续由目前的非营利组织控制。 图片除此之外,还有三项重大决定,它们分别是:现有的营利部门将成为公益公司(PBC)非营利组织将控制PBC,并成为其大股东非营利组织和PBC将继续保持相同的使命OpenAI表示,这次的公司结构调整,是在听取市民领袖的意见,并与特拉华州总检察长办公室和加利福尼亚州总检察长办公室进行建设性对话后所做出的决定。
5/6/2025 10:14:47 AM
谷歌DeepMind:大模型也很任性,知道最优路径偏要撞南墙
大语言模型(LLMs)的成功激发了人们对各种智能体的兴趣。 将 LLM 用于智能体的一个关键假设是,LLMs 利用常识和思维链(Chain-of-Thought, CoT)进行推理,从而智能体可以有效地探索并高效地解决复杂领域的问题。 然而,LLM 智能体存在次优探索和知 - 行差距(knowing-doing gap)的问题,即无法有效地将模型中的知识转化为行动。
5/6/2025 9:08:00 AM
机器之心
DeepSeek开源的文件系统,是如何提升大模型效率的?
在 AI 领域里,大模型通常具有百亿甚至数千亿参数,训练和推理过程对计算资源、存储系统和数据访问效率提出了极高要求。 2 月 28 日,DeepSeek 开源了一种高性能分布式文件系统 3FS,官方表示其目的是解决人工智能训练和推理工作负载的挑战。 作为一种并行文件系统,3FS 可以在 180 节点集群中实现 6.6 TiB/s 的聚合读取吞吐量,对于提高 DeepSeek V3、R1 大模型的训练数据预处理、数据集加载、检查点保存/重新加载、嵌入向量搜索和 KVCache 查找等工作的效率有重要帮助。
5/6/2025 9:03:00 AM
机器之心
68页论文再锤大模型竞技场!Llama4发布前私下测试27个版本,只取最佳成绩
大模型竞技场的可信度,再次被锤。 最近一篇名为《排行榜幻觉》(The Leaderboard Illusion)的论文在学术圈引发关注。 图片它指出,如今被视为LLM领域首选排行榜的Chatbot Arena,存在诸多系统问题。
5/6/2025 1:45:00 AM
DeepSeek还没登场,Qwen3 已经抢先引爆AI开源圈
AI 社区原本期盼 DeepSeek 发布重磅新品,却意外迎来了另一款令人瞩目的中国开源模型:Qwen3 正式登场。 此次发布的旗舰型号为 Qwen3-235B-A22B。 其中,235B 代表总参数量;而 A22B 指的是该模型采用了“专家混合”(Mixture of Experts,简称 MoE)架构,实际在每次查询中激活的参数量仅约为 220亿(22B)。
5/6/2025 12:35:33 AM
前端小智
让GPT-4.1「头皮发麻的考试」!OpenAI给大模型上强度,AI能赢吗?
雕塑在大理石块中已经完成,甚至在我开始工作之前就已经存在。 它就在那里,我只需要凿去多余的材料。 ——米开朗基罗当被问及是如何创作出如此美丽的雕塑时,米开朗基罗说「雕塑已经存在,我只是需要凿去多余的材料」。
5/6/2025 12:22:00 AM
新智元
资讯热榜
苹果发布全新Xcode 26开发者工具:内置ChatGPT先进AI功能
DeepSeek前高管秘密创业,新AI Agent项目已获顶级VC押注
那个男人回来了!Ilya现身多伦多大学毕业典礼:AI 像是用数字方式复制出来的大脑!不管你愿不愿意,AI都将深刻影响你的一生!
支持MCP!开源智能体开发框架 Rowboat:打造你的智能助手只需几分钟
ChatGPT 语音功能升级,实时翻译对话更自然流畅
肝了30小时,Flux Kontext是我用过最稳、最能干活的AI图像模型!
谷歌 Gemini 应用月下载量超越 ChatGPT,用户活跃度仍显不足
长文本理解新王者?Gemini2.5Pro 击败 o3领跑 Fiction.Live 基准测试
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
数据
谷歌
机器人
大模型
Midjourney
用户
智能
开源
微软
GPT
学习
Meta
图像
技术
AI创作
Gemini
论文
马斯克
Stable Diffusion
算法
代码
英伟达
Anthropic
芯片
生成式
开发者
蛋白质
腾讯
神经网络
研究
3D
生成
训练
苹果
计算
智能体
Sora
机器学习
AI设计
AI for Science
Claude
GPU
AI视频
人形机器人
华为
搜索
场景
百度
大语言模型
xAI
预测
伟达
深度学习
Transformer
字节跳动
Agent
模态
具身智能
神器推荐
LLaMA
文本
视觉
Copilot
算力
工具
LLM
驾驶
API
大型语言模型
应用
RAG
亚马逊