文章列表
OpenAI o3 模型基准测试成绩遭质疑,实测分数远不及宣称
OpenAI的o3模型在内部测试与第三方基准测试结果存在显著差异,Epoch研究所独立测试得分仅10%,远低于OpenAI宣称的25%。#AI争议##OpenAI#
4/21/2025 7:24:55 AM
远洋
基于 Spring AI + MCP + DeepSeek-R1-7B 构建企业级智能 Agent 工具调用系统
在大模型 Agent 发展浪潮下,如何通过模型驱动外部工具调用(Tool Calling)已成为构建智能业务系统的关键能力。 本文将手把手带你通过 Spring AI MCP(Model Context Protocol) DeepSeek-R1-7B 打造一个可落地的企业级智能 Agent。 项目背景与架构设计技术选型Spring AISpring 官方推出的 AI 接入框架,支持 LangChain、MCP、RAG 等能力;MCP(Model Context Protocol)模型与工具之间通信的协议桥梁;DeepSeek-R1-7B国产高性能开源大模型,已支持 Chat Completion、Tool Calling 接口;Ragflow用作 RAG 架构引擎(可选);系统功能用户向模型提问模型判断是否调用工具(如数据库查询)MCP 注册的工具服务完成任务模型生成最终响应环境准备安装依赖复制本地部署 DeepSeek-R1-7B 模型推荐使用 vLLM 启动 DeepSeek-R1-7B 模型服务:复制构建 Spring AI MCP 工具服务示例业务:产品信息查询复制注册 MCP 工具复制模型端配置(Ragflow 示例)在 ragflow.config.yaml 中配置模型地址及 MCP 工具启用:复制前端调用(可选)复制测试效果用户输入:复制输出结果:复制模型会自动触发 query-product 工具,无需用户指定,展示 Agent 工具能力。
4/21/2025 4:22:00 AM
编程疏影
超全总结!15个AI视频镜头语言提示词+效果展示
在AI视频创作中,精准的镜头语言是提升作品质感的关键。 本文系统解析15种专业级拍摄技法,从经典50mm镜头到沉浸式FPV视角,结合视觉效果对比,为创作者提供直观的镜头语言应用指南。 超全总结!
4/21/2025 2:00:55 AM
AI设计师Lena
对 ChatGPT 说“谢谢”,竟给 OpenAI 带来“数千万美元”开销
OpenAI CEO透露,仅仅是用户与AI进行的日常寒暄和礼貌性交流,例如“谢谢”和“请”等,就给公司带来了“数千万美元”的开销。#AI成本# #人机互动#
4/20/2025 11:36:07 AM
远洋
ChatGPT 直呼用户姓名引负面反响,用户直呼“毛骨悚然”
部分用户发现ChatGPT会直呼其名,即便未透露姓名也会被称呼,引发负面反响。开发者认为这一功能“令人毛骨悚然”,用户表示困惑和警惕。OpenAI尚未回应,这一现象凸显了AI个性化尝试的“恐怖谷”困境。#ChatGPT##人工智能#
4/20/2025 7:27:19 AM
远洋
计划 30 亿美元收购 Windsurf 前,OpenAI 被曝曾向另一 AI 编程助手 Cursor“示好”
知情人士告诉CNBC,去年OpenAI曾联系Cursor的销售商Anysphere,并在Cursor迎来新一轮热潮时再次接触了它。但谈判始终未能取得实质性进展。
4/19/2025 2:21:43 PM
清源
ChatGPT 低调上线“记忆搜索”功能:个性化搜索结果更精准
ChatGPT在进行网页搜索时,将能够结合记忆中存储的个人信息(IT之家注:例如用户过去提到的饮食偏好)来优化搜索结果。
4/19/2025 8:39:31 AM
清源
OpenAI 新推理模型被曝产生更多“幻觉”,o3 / o4-mini 性能与错误率一同提升
根据 OpenAI 的内部测试,作为推理模型的 o3 和 o4-mini,出现幻觉的频率不仅超过了前代推理模型 o1、o1-mini 和 o3-mini,甚至还高于传统“非推理”模型(IT之家注:如 GPT-4o)。
4/19/2025 7:46:39 AM
清源
DeepSeek 梁文锋入选《时代》周刊“2025 年全球最具影响力 100 人”
梁文锋出现在了“Pioneers(拓荒者)”分类中。企业家名人中,AMD CEO 苏姿丰、Meta CEO 马克・扎克伯格也成功上榜,不过均在“Titans(巨人、伟人)”分类中。
4/18/2025 10:36:04 PM
汪淼
微软全新开源模型 MAI-DS-R1:敏感话题响应提升,安全风险降低
微软在其官网上正式开源了 DeepSeek-R1的魔改版 ——MAI-DS-R1。 这一新模型在保留原有推理性能的基础上,进行了显著的增强,尤其在对敏感话题的响应能力上取得了巨大的突破。 MAI-DS-R1的响应能力达到了99.3%,是原版 R1的两倍多。
4/18/2025 5:00:40 PM
AI在线
银行科技转型加速,大模型应用深入核心业务
随着银行业在数字化型中面临的挑战与压力日益加大,越来越多的银行开始将大模型技术融入到核心业务中,而不仅仅停留在简单的聊天机器人应用上。 最新的财报数据显示,国内一些主要银行在科技投入和大模型应用方面取得了显著进展,但同时也显露出投入的分化趋势。 根据钛媒体 App 对十家主要银行的分析,包括六大国有银行及几家股份制银行,发现其中六家银行的科技投入出现了缩减。
4/18/2025 5:00:39 PM
AI在线
6周搞定18个月的工作量,爱彼迎不满老工具,暴力循环大模型怒迁代码,效果出奇好,怎么回事?谷歌亚马逊也做过类似的事
编辑 | 云昭Anthropic首席执行官Dario时不时就会出来发声,声称人工智能即将取代人工编码,或者抛出一个惊人的数字,预测在短短6个月内将有90%的编码工作将被AI取代。 这种措辞无疑有夸大的成分,但这里想说的是,这并非空穴来风,或许6个月内AI不会取代90%的程序员,但取代90%的编程工作不无可能! 因为企业接纳和适配大模型的速度远比我们想象得要快!
4/18/2025 4:05:39 PM
云昭
谷歌的“双子星”,正在围剿一众大模型
编辑 | 云昭继昨天凌晨OpenAI推出满血o3、o4-mini之后,没想到谷歌迈着“LLM王者”的步伐给出了自家的模型SOTA研究Gemini2.5 Flash。 如果说o3主打的是“干实事”,那么谷歌这次的新发布则是告诉我们:什么是“成本可控”的极致性价比。 这次的发布以后立马引来一众开发者的讨论,不过这次不是负面的,而是全面的好评。
4/18/2025 3:53:03 PM
云昭
别再只玩ChatGPT了!OpenAI悄悄发布《构建 Agent 实战指南》 手把手教你打造智能体
OpenAI 最近悄悄发布了一份 《构建 Agent 实战指南》 (A practical guide to building agents),简直就是一份“AI 打工人”的养成手册!今天,老司机我就带你用最接地气、最有趣的方式,把这份官方秘籍给你扒个底朝天,让你也能轻松 Get 打造专属 AI Agent 的精髓!准备好了吗?发车!等等,Agent 到底是个啥玩意儿?跟普通软件有啥不一样?咱们先搞清楚,Agent 不是你手机里那些按部就班执行命令的 App,也不是只会简单聊天的机器人。 OpenAI 给它下了个定义:Agent 是能独立自主地、代表你完成特定任务的系统。 划重点:独立自主!想想你平时用的软件,比如订票 App,你得一步步告诉它去哪儿、啥时候、坐啥舱位,它才给你结果。
4/18/2025 3:00:39 PM
AI在线
Midjourney图像编辑器重磅更新,新图层功能、智能选择工具
Midjourney宣布对其图像编辑器进行重大更新,引入了焕然一新的用户界面(UI)、图层功能、智能选择工具以及更智能的审核系统。 这一更新不仅优化了用户体验,还显著提升了AI图像编辑的灵活性与精准度,进一步巩固了Midjourney在AI艺术生成领域的领先地位。 焕新UI:更直观的操作体验Midjourney图像编辑器此次更新的一大亮点是全新设计的用户界面。
4/18/2025 3:00:39 PM
AI在线
华晨宝马与字节跳动火山引擎合作,推动AI赋能汽车营销
近日,华晨宝马领悦数字信息技术有限公司(“领悦”)与字节跳动旗下火山引擎达成合作,双方将在人工智能(AI)技术的帮助下创新汽车营销服务。 此次合作通过AI技术实现精准的产品匹配与购车建议,优化内容引导,提升用户购车体验及经销商运营效率。 宝马集团大中华区总裁高翔表示,AI是宝马打造更智能、贴心出行解决方案的关键,正在加速融入研发、生产、供应链、产品、服务及运营各个环节。
4/18/2025 3:00:39 PM
AI在线
谷歌 Gemini 2.5 Flash 混合推理 AI 模型上线:性能成本双优
谷歌公司昨日(4 月 17 日)发布公告,宣布在 Google AI Studio 和 Vertex AI 中,以 Gemini API 的方式推出 Gemini 2.5 Flash Preview 预览 AI 模型。
4/18/2025 2:59:20 PM
故渊
知识图谱与其它知识库的关系
知识图谱与传统知识库:解构数据连接的哲学传统企业数据库和知识库长期以来一直被当作信息的仓库,它们好比一个个分隔的抽屉,每个抽屉里都整齐地存放着特定类型的信息。 企业习惯了这种存储方式,却很少思考:我们真的需要将信息放在不同的抽屉里吗? 知识图谱打破了这种传统思维,它将信息视为一张巨大的网络——每条信息都是网络中的一个节点,节点之间通过各种关系连接起来。
4/18/2025 12:49:58 PM
大数据AI智能圈