理论
OpenAI深夜开源HealthBench,60个国家合力开发5000段真实对话
今天凌晨1点30,OpenAI开源了一个专门面向医疗大模型的测试评估集——HealthBench。 与以往测试集不同的是,该测试集的5000段核心测试对话,全部由来自60个国家/地区的26个专业262名医生打造,极大增强了该测试集的难度、真实性以及丰富度。 并且采用了多轮对话测试,而不是简单的答题或选择题模式。
5/13/2025 9:08:00 AM
AI训练的反直觉发现:添加"有毒"数据反而能造就更好的语言模型?
"当坏数据能够创造出好模型,AI训练领域又一个传统观念被颠覆"你有没有听说过这样一个说法:垃圾进,垃圾出? 在AI大语言模型的训练中,这一直是个不言自明的准则。 工程师们花费大量时间和资源过滤训练数据,移除那些含有有毒、有害或不适当内容的文本,以防止模型学习和生成这些内容。
5/13/2025 2:22:00 AM
无影寺
国产大模型「五强争霸」,决战AGI!
DeepSeek的横空出世,已经彻底改变了全球的AI局势。 从此,不仅中美大模型竞争格局改变,国产大模型的产业版图,也被一举打破! 纵观中国基础大模型的市场,可以看到,如今的基础大模型版图已然改天换地,演变为全新的五强格局——字节、阿里、阶跃星辰、智谱,以及DeepSeek。
5/13/2025 2:00:22 AM
新智元
OpenAI命悬一线,微软连夜割肉!跪求OpenAI千万别分手
OpenAI和微软,快要闹崩了! 面对着想要上市的OpenAI,不惜割肉续命,绝不能让自己的130亿投资打水漂。 英国金融时报刚刚曝出,OpenAI和微软,正在重新协商数十亿美元的合作条款。
5/12/2025 6:26:55 PM
新智元
痛斥!现在的MCP,就像尿裤子!创业CTO试用后怒气值飙升,开怼整个大模型圈怪象:开发文档用大模型写的!网友:召唤MCP适配器
作者 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)现在的MCP乃至大模型开发圈,就像尿了裤子! 一开始热乎乎的,然后就开始难受了! 近日,一篇有关MCP深度批判的博客文章《A Critical Look at MCP》在网络上走红。
5/12/2025 3:07:01 PM
云昭
Copilot上大分,仅数天,陶哲轩的估计验证工具卷到2.0!刚刚又发数学形式化证明视频
本周二,我们报道了菲尔兹奖得主陶哲轩的一个开源项目 —— 在大模型的协助下编写了一个概念验证软件工具,来验证涉及任意正参数的给定估计是否成立(在常数因子范围内)。 在项目中,他开发了一个用于自动(或半自动)证明分析中估计值的框架。 估计值是 X≲Y(在渐近记法中表示 X=O (Y))或 X≪Y(在渐近符号中表示 X=o (Y))形式的不等式。
5/12/2025 9:05:00 AM
突发!OpenAI正与微软洽谈新融资,筹备IPO
昨晚,金融时报消息,OpenAI和微软正在重新洽谈数十亿美元的合作条款。 这场谈判旨在让OpenAI能够进行未来的首次公开IPO募股,同时保护微软对前沿AI的访问权限。 微软作为OpenAI最大的支持者,是其重组从非营利转向营利的关键阻碍。
5/12/2025 8:59:26 AM
OpenAI神秘项目曝光:cderGPT,用AI加速药物评估
OpenAI又一个神秘项目曝光了——名字叫做cderGPT,专门用来给药物评估这事提一提速度。 据Wired发布的消息来看,OpenAI的高层为了这个项目,已经与美国食品药品监督管理局(FDA)和马斯克的效率部门进行了多次讨论。 至于为什么要做这么个事,FDA局长Marty Makary在X上发表了他的看法:FDA现在不得不直面一些前所未有的重大问题:为什么一款新药上市要耗费十年以上的时间?
5/9/2025 8:35:00 AM
刚刚,OpenAI任命新CEO!
刚刚,OpenAI迎来新CEO。 奥特曼发文称,Fidji Simo将以「应用CEO」全新身份加入OpenAI,向他本人汇报。 图片奥特曼依旧还是OpenAI CEO,不过未来将专注于研究、算力与安全。
5/8/2025 4:40:27 PM
新智元
突发,OpenAI官宣新的CEO!奥特曼发文祝贺,新CEO来自“美国版美团”!
出品 | 51CTO技术栈(微信号:blog51cto)刚刚,OpenAI官宣了新的CEO!别急,倒不是奥特曼卸任了。 而是OpenAI开设了一个新岗位:应用首席执行官。 来自Instacart 的首席执行官 Fidji Simo 官宣将加入 OpenAI,担任应用部门的 CEO。
5/8/2025 3:42:15 PM
低价大模型 DeepSeek 实用指南
火爆全网的国产大模型 DeepSeek,其 API 价格仅为同类模型的几十分之一。 图片DeepSeek 网页端与 API 应用场景DeepSeek 网页端界面简洁直观,但 API 使用需要一定技巧。 本文将从对话、知识库、AI 翻译、AI 编程及 Python 调用等多个场景,分篇评测 DeepSeek API 的实际应用。
5/8/2025 8:10:25 AM
红绿灯灯灯灯
机器人界「Sora」来了!清华、星动纪元开源首个AIGC机器人大模型,入选ICML2025 Spotlight
从 2023 年的 Sora 到如今的可灵、Vidu、通义万相,AIGC 生成式技术的魔法席卷全球,打开了 AI 应用落地的大门。 无独有偶,AIGC 生成式技术同样在具身智能机器人大模型上带来了惊人的表现。 “给我盛一碗热腾腾的鸡汤”,以前这句话能带给你一个温暖感人、栩栩如生的视频。
5/7/2025 1:48:48 PM
机器之心
掷30亿美元,OpenAI史上最大收购案!
OpenAI史上最大一笔收购即将敲定。 彭博爆料称,OpenAI将豪掷30亿美元,吞并了爆火编码神器Windsurf(前身为Codeium)。 此前,早有外媒曝出了这笔交易,目前离最终达成接近尾声。
5/7/2025 10:09:28 AM
新智元
刚刚,Gemini 2.5 Pro升级,成编程模型新王
你的默认编程模型是什么? 或许可以换一换了。 刚刚,Google DeepMind 发布了 Gemini 2.5 Pro 的最新更新版本:Gemini 2.5 Pro (I/O edition)。
5/7/2025 10:01:35 AM
从看见到理解,多模态大模型如何重塑行为检测
在人工智能技术快速迭代的今天,行为检测作为计算机视觉领域的重要分支,正迎来一场由多模态大模型引领的技术革命。 作为曾在CV算法公司工作的从业者,我深刻体会到传统计算机视觉方法在实际落地中的诸多痛点。 过去几年,许多行为检测、烟火检测等应用,往往因为高昂的训练成本和难以接受的误报率而被甲方叫停。
5/7/2025 1:00:00 AM
贝塔街的万事屋
三分钟快速入门大模型数据工程
向自然语言处理的大模型应用,数据工程的核心任务是构建一套高效、可扩展、可控的数据流程,从源头到可用于模型训练、推理的高质量文本语料,全链路打通。 数据工程的整体目标构建稳定的数据流转链路,从原始文本数据 → 清洗/标注/审核后的语料 → 符合模型输入格式的数据集保证数据可用性、完整性、质量、结构统一性支持多阶段使用场景:训练/微调、推理RAG、评估测试等数据来源最常见的形式是甲方提供,如客户工单、业务知识库、客服聊天记录、FAQ 等。 需尽早明确数据格式、内容范围、隐私边界。
5/7/2025 12:10:00 AM
贝塔街的万事屋
OpenAI转型计划遇阻:继续由非营利实体控制,重组方案被迫调整
当地时间5月5日,人工智能研究公司OpenAI宣布,其转型计划遭遇重大调整,将继续由其非营利性母公司控制,同时推进营利性部门的结构调整,以在激烈的AI竞赛中筹集更多资金并保持领先地位。 去年12月,OpenAI公布了一项重组计划,拟转型为一家公益企业(Public Benefit Corporation,简称PBC),称这将有助于吸引更多投资,并摆脱现行非营利架构带来的限制。 然而,这一计划却遭到了外界的猛烈批评及法律挑战,甚至引发了世界首富埃隆·马斯克的诉讼。
5/6/2025 3:48:25 PM
刚刚,OpenAI公司结构重大调整:继续由非营利实体控制,营利性部门要变公益公司
OpenAI的公司结构,终于是尘埃落定了。 就在刚刚,OpenAI官方重磅宣布:将继续由目前的非营利组织控制。 图片除此之外,还有三项重大决定,它们分别是:现有的营利部门将成为公益公司(PBC)非营利组织将控制PBC,并成为其大股东非营利组织和PBC将继续保持相同的使命OpenAI表示,这次的公司结构调整,是在听取市民领袖的意见,并与特拉华州总检察长办公室和加利福尼亚州总检察长办公室进行建设性对话后所做出的决定。
5/6/2025 10:14:47 AM
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
马斯克
AI创作
智能体
英伟达
Anthropic
论文
代码
AI新词
训练
算法
Stable Diffusion
芯片
LLM
蛋白质
开发者
腾讯
Claude
苹果
生成式
AI for Science
Agent
神经网络
3D
机器学习
研究
xAI
生成
人形机器人
AI视频
计算
百度
Sora
GPU
AI设计
华为
工具
大语言模型
RAG
搜索
具身智能
字节跳动
大型语言模型
场景
深度学习
预测
视频生成
伟达
视觉
Transformer
AGI
架构
亚马逊
神器推荐
Copilot
DeepMind
特斯拉
应用