chatgpt
OpenAI 发布 HealthBench:评估大型语言模型在医疗领域表现的新标准
近日,OpenAI 发布了一款名为 HealthBench 的开源评估框架,旨在测量大型语言模型(LLMs)在真实医疗场景中的表现和安全性。 此框架的开发得到了来自60个国家和26个医学专业的262名医生的支持,旨在弥补现有评估标准的不足,特别是在真实应用、专家验证和诊断覆盖方面。 现有的医疗 AI 评估标准通常依赖于狭窄、结构化的形式,如多项选择考试。
5/13/2025 3:00:52 PM
AI在线
OpenAI 高管:AI 未来可自主生成知识,商业与科研迎来革命
Pachocki强调,AI通过无监督预训练和强化学习(RLHF)构建“世界模型”,并将其转化为实用助手。他还预测,到本世纪末,AI将在自主研究领域取得重大进展,甚至可能在今年内实现近乎自主的软件开发。
5/13/2025 1:46:00 PM
故渊
OpenAI新领导上任第一把火:DeepResearch一个小改动被网友狂赞!终于可导出PDF网友:啥时候能导出ChatGPT?
编辑 | 云昭就在刚刚! OpenAI 为其 Agent 代表作 Deep Research 功能推出了一项全新的 PDF 导出功能,允许用户下载格式完整的研究报告,包括表格、图片和可点击的引用链接。 这一看似不起眼的小动作意外引来了大批量用户的欢呼!
5/13/2025 12:47:16 PM
云昭
ChatGPT 推出 SharePoint 连接器,企业数据分析更高效!
根据最新消息,ChatGPT 现在推出了一项新的功能,允许用户通过 SharePoint 连接器访问公司数据。 这一功能目前处于测试阶段,面向 ChatGPT Plus、Pro 和 Team 用户开放。 通过这一集成,ChatGPT 能够从多个 SharePoint 站点中分析和总结内容,并附带来源引用。
5/13/2025 11:00:52 AM
AI在线
OpenAI 扩展 ChatGPT AI 深度研究连接器,集成微软 OneDrive 和 SharePoint
OpenAI 昨日(5 月 12 日)更新 ChatGPT 日志文件,宣布面向 ChatGPT Plus、Pro 和 Team 用户(EEA、瑞士和英国除外),扩展 ChatGPT AI 聊天机器人深度研究连接器,集成微软 OneDrive 和 SharePoint。
5/13/2025 10:25:31 AM
故渊
OpenAI推出深度研究报告一键导出PDF功能
人工智能领域的领军企业OpenAI宣布,为其ChatGPT深度研究(Deep Research)工具新增了一项重要功能——一键将深度研究报告导出为PDF。 此功能不仅提升了研究报告的实用性,还进一步推动了AI在企业场景中的落地应用。 功能亮点:完整保留格式,专业输出OpenAI的深度研究工具能够通过多步骤网络搜索和信息整合,生成包含引用、表格和图片的详尽报告。
5/13/2025 10:01:02 AM
AI在线
OpenAI深夜开源HealthBench,60个国家合力开发5000段真实对话
今天凌晨1点30,OpenAI开源了一个专门面向医疗大模型的测试评估集——HealthBench。 与以往测试集不同的是,该测试集的5000段核心测试对话,全部由来自60个国家/地区的26个专业262名医生打造,极大增强了该测试集的难度、真实性以及丰富度。 并且采用了多轮对话测试,而不是简单的答题或选择题模式。
5/13/2025 9:08:00 AM
OpenAI 发布并开源医疗测试基准 HealthBench,旨在更好地衡量 AI 系统在医疗健康领域能力
与以往测试集不同的是,HealthBench 的 5000 段核心测试对话,由来自 60 个国家 / 地区的 26 个专业 262 名医生打造,极大增强了该测试集的难度、真实性以及丰富度。
5/13/2025 8:41:48 AM
问舟
AI训练的反直觉发现:添加"有毒"数据反而能造就更好的语言模型?
"当坏数据能够创造出好模型,AI训练领域又一个传统观念被颠覆"你有没有听说过这样一个说法:垃圾进,垃圾出? 在AI大语言模型的训练中,这一直是个不言自明的准则。 工程师们花费大量时间和资源过滤训练数据,移除那些含有有毒、有害或不适当内容的文本,以防止模型学习和生成这些内容。
5/13/2025 2:22:00 AM
无影寺
关税带来不确定性,软银、OpenAI 千亿美元“AI 基建”项目被曝陷入停滞
今年 1 月,软银创始人孙正义与 OpenAI 联合创始人奥尔特曼发布“星际之门”计划,宣称将“立即”启动 1000 亿美元投资,并最终扩大至约 5000 亿美元。
5/12/2025 6:29:48 PM
清源
OpenAI命悬一线,微软连夜割肉!跪求OpenAI千万别分手
OpenAI和微软,快要闹崩了! 面对着想要上市的OpenAI,不惜割肉续命,绝不能让自己的130亿投资打水漂。 英国金融时报刚刚曝出,OpenAI和微软,正在重新协商数十亿美元的合作条款。
5/12/2025 6:26:55 PM
新智元
ChatGPT推出全新PDF导出功能,优化深度研究报告体验
ChatGPT 最近推出了一项备受期待的新功能 —— 用户现在可以将深度研究(Deep Research)报告直接导出为 PDF 格式。 这一功能的推出,旨在解决用户在复制报告内容时格式丢失的问题,让研究成果的分享变得更加简便。 ChatGPT 的深度研究功能利用先进的自动化技术,用户只需输入相应的提示词,系统就能够独立进行复杂的多步骤研究。
5/12/2025 6:00:52 PM
AI在线
ChatGPT 深度研究新增导出为 PDF 功能,可保留报告格式
ChatGPT深度研究功能新增PDF导出选项,解决用户复制粘贴时格式丢失的痛点。同时推出GitHub连接器,面向团队订阅用户开放。#ChatGPT新功能# #AI研究工具#
5/12/2025 4:15:25 PM
远洋
OpenAI 聘请前 Facebook 应用主管 Simo 为新任应用业务负责人
OpenAI 近日宣布,已经聘请 Instacart 首席执行官以及前 Facebook 应用主管 Fidji Simo 担任公司新设立的应用业务负责人。 OpenAI 首席执行官山姆・阿尔特曼(Sam Altman)在社交媒体平台 X 上发表声明,表示这一新角色的引入将使他能够将更多的时间和精力投入到研究、计算和安全等重要领域。 Fidji Simo 在2011年加入 Facebook,并于2019年被任命为 Facebook 应用的负责人。
5/12/2025 11:00:52 AM
AI在线
OpenAI与微软正商讨修改双方合作条款
根据英国《金融时报》的报道,OpenAI 和微软正在商讨修改双方的合作条款,这一调整可能为 ChatGPT 的开发公司打开未来上市的大门,并确保微软能持续获取前沿的人工智能技术。 此次谈判不仅关乎 OpenAI 的商业模式,也涉及到微软在这项技术领域的重要投资。 据知情人士透露,微软正在考虑放弃其在 OpenAI 新营利性业务中的部分股权,以换取在2030年一项重要合同到期后,能够使用 OpenAI 新开发的人工智能模型。
5/12/2025 10:01:12 AM
AI在线
突发!OpenAI正与微软洽谈新融资,筹备IPO
昨晚,金融时报消息,OpenAI和微软正在重新洽谈数十亿美元的合作条款。 这场谈判旨在让OpenAI能够进行未来的首次公开IPO募股,同时保护微软对前沿AI的访问权限。 微软作为OpenAI最大的支持者,是其重组从非营利转向营利的关键阻碍。
5/12/2025 8:59:26 AM
OpenAI ChatGPT 更新后过度讨好用户,两周过去问题仍未解决
OpenAI更新ChatGPT-4o后,AI表现出过度讨好用户的行为,甚至对荒谬想法也大加赞赏。CEO奥尔特曼撤回更新,但问题仍未解决。专家指出,AI的奉承倾向源于训练机制,可能引发社会问题。#AI伦理##ChatGPT#
5/11/2025 9:15:07 PM
远洋
“AGI 比恩怨更重要”:OpenAI 奥尔特曼向马斯克示好
奥尔特曼与马斯克的关系可谓一波三折:两人曾是 OpenAI 的联合创始人,如今却在 AI 领域各自为战,成为针锋相对的竞争者。
5/10/2025 7:49:12 PM
清源
资讯热榜
苹果发布全新Xcode 26开发者工具:内置ChatGPT先进AI功能
DeepSeek前高管秘密创业,新AI Agent项目已获顶级VC押注
那个男人回来了!Ilya现身多伦多大学毕业典礼:AI 像是用数字方式复制出来的大脑!不管你愿不愿意,AI都将深刻影响你的一生!
支持MCP!开源智能体开发框架 Rowboat:打造你的智能助手只需几分钟
ChatGPT 语音功能升级,实时翻译对话更自然流畅
谷歌 Gemini 应用月下载量超越 ChatGPT,用户活跃度仍显不足
长文本理解新王者?Gemini2.5Pro 击败 o3领跑 Fiction.Live 基准测试
肝了30小时,Flux Kontext是我用过最稳、最能干活的AI图像模型!
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
数据
谷歌
机器人
大模型
Midjourney
用户
智能
开源
微软
GPT
学习
Meta
图像
技术
AI创作
Gemini
论文
马斯克
Stable Diffusion
算法
代码
英伟达
Anthropic
芯片
生成式
开发者
蛋白质
腾讯
神经网络
研究
3D
生成
训练
苹果
计算
智能体
Sora
机器学习
AI设计
AI for Science
Claude
GPU
AI视频
人形机器人
华为
搜索
场景
百度
大语言模型
xAI
预测
伟达
深度学习
Transformer
字节跳动
Agent
模态
具身智能
神器推荐
LLaMA
文本
视觉
Copilot
算力
工具
LLM
驾驶
API
大型语言模型
应用
RAG
亚马逊