文章列表
基于Gemini与Qdrant构建生产级RAG管道:设计指南与代码实践
一、RAG技术的核心价值与应用场景在人工智能领域,检索增强生成(Retrieval-Augmented Generation, RAG)正成为解决大语言模型(LLM)知识更新滞后、生成内容不可追溯等问题的关键技术。 传统的微调(Fine-Tuning)方法将知识固化在模型参数中,难以应对动态领域的快速变化;而RAG通过将检索与生成解耦,实现了知识的实时更新与可追溯性,尤其适用于政策频繁变动、对准确性要求极高的场景,如医疗、法律和航空管理。 本文以构建机场智能助理为例,结合Google的Gemini多模态模型与Qdrant向量数据库,详细阐述如何设计并实现一个高可靠、可扩展的生产级RAG管道。
6/3/2025 2:55:00 AM
大模型之路
阿里发布 QwenLong-L1 超长文本杀器!已开源、支持 120k 长上下文、具备“翻书回溯”能力
业界普遍认为AI上下文越长越好,但这存在一个核心矛盾:模型能“吞下”海量信息,却难以真正“消化”。 面对长文,它们会忘记要点、无法深入推理,这已成为一大瓶颈。 例如,AI 能记住第1页的内容,同时理解第100页的观点,并将两者联系起来进行推理吗?
6/3/2025 12:00:09 AM
在法庭摘要中使用 ChatGPT 生成不存在案例,美国一名律师遭法院制裁
这份摘要的部分内容疑似由 AI 生成,其中包含错误的引用,还包括一则无法在任何法律数据库中找到的案例内容,这种信息只在 ChatGPT 中出现。此外,还有与申请内容毫不相关的案例。
6/2/2025 10:21:55 AM
清源
百度 AI 搜索宣布全面接入 DeepSeek R1 最新版,推理能力更强
今日,百度AI搜索宣布全面接入深度思考模型DeepSeek R1-0528 ,用户可通过PC端、APP端免费使用。
5/31/2025 3:08:07 PM
问舟
英伟达 CEO 黄仁勋:中国的 Deepseek 和阿里通义千问是当前最佳开源模型
他表示,DeepSeek 和阿里巴巴的通义千问(Qwen)是“当前表现最优的开源 AI 模型之一”,已在美国、欧洲等多个市场获得广泛应用。
5/30/2025 9:07:30 PM
清源
研究人员揭示大模型并非真正推理,只是在 “找关系”
随着人工智能(AI)技术的飞速发展,越来越多的研究人员开始对大型语言模型(如 ChatGPT)进行深入探讨。 近日,亚利桑那州立大学的研究小组在预印本平台 arXiv 上发表了一项引人关注的论文,指出我们对这些 AI 模型的理解可能存在误区。 他们认为,这些模型实际上并不会进行真正的思考或推理,而仅仅是在寻找相关性。
5/30/2025 6:00:54 PM
AI在线
OpenAI 坚决反击马斯克:法院裁定请求毫无依据
据路透社报道,OpenAI 近日向法院提出申请,要求继续对特斯拉创始人埃隆・马斯克进行反诉。 OpenAI 在法庭文件中表示,马斯克请求驳回其反诉的动议 “毫无事实依据”。 这一案件的持续发酵,再次引发了公众的关注。
5/30/2025 3:00:54 PM
AI在线
专治AI生图「人脸崩坏」,8倍速碾压GPT!新版FLUX.1多方位刷新SOTA
用AI生成&编辑图片时,想生成一套完整故事模板,结果主角「变脸」比翻书还快,这可怎么办? 别慌,全新图像模型FLUX.1 Kontext来了! 支持上下文内图像生成,可以同时使用文本和图像进行提示,并能够无缝提取和修改视觉概念,从而生成新的、连贯的图像。
5/30/2025 2:28:10 PM
新智元
假冒阿里云AI SDK遭恶意代码渗透,AI安全供应链面临新挑战
近年来,开发者们在开放源代码组件库中愈发成为网络攻击的目标,黑客利用假冒软件包进行供应链攻击的手段不断升级,最近甚至扩展到了伪造的人工智能(AI)框架和被污染的机器学习(ML)模型。 近期,一项研究揭示了黑客通过上传伪装成阿里云 AI 实验室开发工具包的恶意软件包,成功实施了这一攻击。 研究人员在 Python Package Index(PyPI)上发现了三个恶意软件包,它们假冒了阿里云 AI 实验室的 SDK,实际上并没有任何合法功能。
5/30/2025 12:00:54 PM
AI在线
未来五年,AI 可能取代一半入门级白领工作
在最近的一次采访中,Anthropic 公司的首席执行官达里奥・阿莫代伊(Dario Amodei)发出了一个引人注目的警告。 他表示,随着人工智能(AI)技术的快速发展,未来五年内,可能会有一半的入门级白领工作被取代,而失业率则可能飙升至10% 到20%。 阿莫代伊强调,许多工人并没有意识到这种变化即将到来,很多人对此感到难以置信。
5/30/2025 11:00:54 AM
AI在线
Midjourney V7重磅更新:渲染速度飙升40%,新增用户投票决定功能开发
Midjourney 官方今日通过社交媒体发布三项重要更新,展示了其持续优化用户体验和社区参与的努力。 首先,Midjourney V7版本的渲染速度提升了约40%。 这一显著改进意味着用户能够更快地生成高质量图像,大幅提升创作效率。
5/30/2025 11:00:54 AM
AI在线
特拉华州检察长聘请银行评估 OpenAI 的转型计划
据《华尔街日报》报道,特拉华州的检察长正在聘请一家投资银行,旨在对 OpenAI 的营利性转型计划提供咨询。 这一独立评估可能会延长 OpenAI 的转型进程,甚至可能进一步影响公司的计划。 OpenAI 的转型将有助于吸引新的投资,并最终实现上市。
5/30/2025 11:00:54 AM
AI在线
OpenAI o3 AI 推理模型成关键“侦探”,发现 Linux 内核高危漏洞
安全专家 Sean Heelan 于 5 月 22 日发布博文,报道称在 OpenAI 的 o3 推理模型帮助下,他成功发现了 Linux 内核重大漏洞,追踪编号为 CVE-2025-37899。
5/30/2025 10:39:45 AM
故渊
纽约时报与亚马逊达成人工智能内容授权协议
在经历了近两年的法律纠纷后,《纽约时报》终于与亚马逊达成了一项新的协议,允许后者使用其编辑内容来训练其人工智能平台。 这项协议标志着《纽约时报》首次将其内容授权给一家科技巨头,以支持生成式人工智能的发展。 图源备注:图片由AI生成,图片授权服务商Midjourney根据《纽约时报》的声明,该协议不仅包括新闻文章,还涵盖了《纽约时报烹饪》(NYT Cooking)网站上的食谱和美食相关内容,以及体育网站 The Athletic 的材料。
5/30/2025 10:01:19 AM
AI在线
Anthropic重磅开源!“电路追踪”工具解锁AI大脑,揭秘大模型决策全过程
近年来,大语言模型(LLM)的快速发展为人工智能领域带来了前所未有的突破,但其内部决策过程却常常被视为“黑盒子”,难以捉摸。 5月29日,AI研究领域的明星公司Anthropic发布了一项重大开源成果——“电路追踪”(Circuit Tracing)工具,为破解大模型的内部工作机制提供了全新视角。 这一工具不仅能帮助研究人员深入探索AI的“思考”过程,还为推动更透明、可控的AI发展迈出了重要一步。
5/30/2025 10:01:14 AM
AI在线
博士级AI智能体写的论文,首次登上顶会ACL!人类作者只是监工
有个叫Zochi的AI系统写了一篇研究论文,并且被顶级学术会议ACL 2025的主会场接受了! ACL是自然语言处理(NLP)领域里最顶尖的会议之一。 Zochi是Intology AI开发的首个博士级智能体,就像一个从头到尾完成科学研究「AI科学家」。
5/30/2025 9:15:00 AM
百度智能云千帆大模型平台、文小言接入DeepSeek-R1-0528模型
百度智能云千帆大模型平台正式上架了 DeepSeek 最新的 R1-0528大模型。 这一重要更新于5月29日上线,旨在为企业和用户提供更强大的 AI 能力和支持。 千帆模型开发平台不仅上架了这一全新大模型,还同步推出了一系列实用功能,包括批量推理、模型评估、推理日志挖掘分析以及模型蒸馏。
5/30/2025 9:05:04 AM
AI在线
AI仅凭“自信”学会推理,浙大校友复刻DeepSeek长思维链涌现,强化学习无需外部奖励信号
复刻DeepSeek-R1的长思维链推理,大模型强化学习新范式RLIF成热门话题。 UC Berkeley团队共同一作Xuandong Zhao把这项成果称为:大模型无需接触真实答案,仅通过优化自己的信心,就能学会复杂推理。 具体来说,新方法完全不需要外部奖励信号或标注数据,只需使用模型自身的置信程度作为内在奖励信号。
5/30/2025 9:05:00 AM