文章列表
一文读懂大模型 RAG:检索、增强与生成的技术详解
大模型(Large Language Model,LLM)的浪潮已经席卷了几乎各行业,但当涉及到专业场景或行业细分领域时,通用大模型往往面临专业知识不足的问题。 相对于成本昂贵的“Post-Training”或“Supervised Fine-Tuning”(监督微调,SFT),基于RAG的技术方案成为了一种更优选择。 本文笔者将从RAG所解决的问题及模拟场景入手,详细总结相关技术细节,与大家分享~一、初识:RAG所解决的问题及模拟场景1.
3/4/2025 9:10:00 AM
小喵学AI
国内第一波弃用 DeepSeek 的公司:潞晨科技官宣暂停相关 API 访问
3 天前,DeepSeek 官方公布线上系统理论成本利润率达 545%。几乎同一时间,“清华系”AI Infra 企业 —— 潞晨科技,突然宣布暂停 DeepSeek API 访问服务。
3/4/2025 8:57:38 AM
周文猛
腾讯元宝下载量超DeepSeek 登顶苹果免费App下载榜第一
腾讯旗下的大模型AI应用——腾讯元宝,在苹果中国区App Store的免费App下载排行榜上实现了突破性进展,成功超越DeepSeek,占据了榜首位置。 目前,免费榜前五的App依次为腾讯元宝、DeepSeek、个人所得税、豆包以及红果短剧。 腾讯元宝自接入DeepSeek以来,腾讯公司便加大了对其的推广力度。
3/4/2025 8:05:00 AM
AI在线
科大讯飞出品!人人都能懂的AI大模型科普课
在当今科技飞速发展的时代,一个名为"AIGC"(Al Generated Content,人工智能生成内容)的概念正逐渐走进公众视野,并迅速成为各界热议的话题。 无论是社交媒体上的讨论,还是专业论坛中的交流,AIGC都成为了不可忽视的存在。 它不仅代表着技术进步的一个重要里程碑,更是预示着未来内容创作方式的一场深刻变革。
3/4/2025 1:06:18 AM
团队iFlytek STC UXD
DeepSeek提示词超能手册:五大核心技巧,榨干AI生产力!
🎯 技巧1:R-T-F黄金三件套——角色 任务 格式锁定AI身份,输出不跑偏! R (Role):角色,明确AI需要扮演的身份或专家领域。 T (Task):任务,清晰定义AI需完成的具体目标。
3/4/2025 12:35:00 AM
新叔
用上DeepSeek,改简历快人一步:AI简历优化保姆级教程
作为科技博主,我测评过上百款AI工具,今天给大家安利一个简历优化的"外挂神器"——DeepSeek。 它能让你的简历从"已读不回"变成"收割offer",操作比美图秀秀还简单,特别适合没经验的应届生和转行小白。 一、为什么需要AI改简历?
3/4/2025 12:00:55 AM
架构师秋天
DeepSeek推出后,移动端AI风向要变
或许下一波 AI 创新,不是比谁的模型更大,而是比谁的模型离你更近。 DeepSeek R1 正在对整个科技领域产生巨大影响,颠覆人们有关 AI 的认知。 在移动端,革新正在快速发生。
3/3/2025 9:07:00 PM
机器之心
万字梳理:揭秘 DeepSeek 中的 RL 与 AGI 下一步丨AIR 2025
在 DeepSeek 能够破圈而出的一众原因中,完全摒弃传统的监督微调(SFT)、转而采用大规模强化学习(RL)的创新之处是关键所在,这使得模型推理能力在质上取得显著突破,更证明了强化学习在提升大语言模型推理能力方面的巨大潜力。 近几年,学界和业界关于 RL 和 LLM 也涌现出了颇多具备开创性意义的研究成果。 在 AI 智能体推理与决策研讨会(AIR 2025)上,来自伦敦大学学院、加州大学伯克利分校、普林斯顿大学、华盛顿大学、卡内基梅隆大学、Meta、华为等多位学术界和工业界的研究人员围绕强化学习、推理决策、AI 智能体展开讨论,回答了诸多问题,例如:AI 系统如何模拟类人推理和决策过程?
3/3/2025 8:26:00 PM
王悦
中信特钢成功接入 DeepSeek-R1 大模型,推进数字化转型
中信特钢在数字化转型领域迈出了重要一步,近日在互动平台上宣布已成功接入 DeepSeek-R1大模型。 公司表示,未来将致力于推动数字技术与实体经济的深度融合,以此为基础进行全方位的改革,力求加快构建数据资产并挖掘数据的潜在价值。 中信特钢在推进智能运维方面的努力,是企业在激烈市场竞争中的一项战略举措。
3/3/2025 5:57:00 PM
AI在线
深圳发布具身智能机器人技术创新行动计划,聚焦多模态大模型构建
近日,深圳市科技创新局印发了《深圳市具身智能机器人技术创新与产业发展行动计划(2025-2027年)》,该计划旨在推动具身智能技术的全面发展。 文件中明确提出,要构建具身智能基座以及垂直领域的大模型,标志着深圳在智能机器人领域迈出了重要一步。 此次行动计划的核心在于基于世界模型以及视觉 - 触觉 - 语言 - 动作(VTLA)等多模态输入输出,开发出具备交互、预测和决策能力的具身智能大模型。
3/3/2025 4:52:00 PM
AI在线
PVUW视频分割Workshop@CVPR 2025 | 征稿!比赛!
第四届真实世界下的像素级视频理解挑战赛(The 4th PVUW challenge)主页/Call for Paper::复杂场景视频目标分割挑战赛(MOSE Challenge):参赛、数据集下载::基于动作描述的指向性视频分割挑战赛(MeViS Challenge):参赛、数据集下载: 真实世界下的像素级视频理解(Pixel-level Video Understanding in the Wild, PVUW)挑战赛将于 CVPR 2025 期间在美国田纳西州纳什维尔的 Music City Center 举办。 像素级场景理解是计算机视觉中的核心问题之一,旨在识别图像中每个像素的类别、掩码和语义。 然而,现实世界是动态的,基于视频的,而非静态的图像状态,因此学习进行视频分割对于实际应用来说更为合理和实用。
3/3/2025 4:37:00 PM
新闻助手
大模型是一场新的搜索战争,OpenAI不会赢家通吃,一家最好被收购!硅谷知名投资人曝料特朗普希望马斯克更积极裁撤美政府预算
编辑 | 言征出品 | 51CTO技术栈(微信号:blog51cto)最近DeepSeek开源周带来了很多惊喜与热议。 但小编发现大家对于马斯克的Grok3的讨论却远远不够充分。 作为“大模型球赛”的最不可捉摸的强大力量,马斯克的xAI最新模型已经上线,便迅速登顶了iPhone的下载排行榜,引起的轰动同样不可小觑。
3/3/2025 12:59:39 PM
言征
中国团队首次夺魁!无问芯穹FlightVGM获FPGA'25最佳论文,峰值算力超GPU21倍
国际可重构计算领域顶级会议 ——FPGA 2025 在落幕之时传来消息,今年的最佳论文颁发给了无问芯穹和上交、清华共同提出的视频生成大模型推理 IP 工作 FlightVGM,这是 FPGA 会议首次将该奖项授予完全由中国大陆科研团队主导的研究工作,同时也是亚太国家团队首次获此殊荣。 这项工作首次在 FPGA 上实现了视频生成模型(Video Generation Models, VGMs)的高效推理,也是该团队继去年在 FPGA 上加速大语言模型 FlightLLM(FPGA’24)后的最新系列工作。 与 NVIDIA 3090 GPU 相比,FlightVGM 在 AMD V80 FPGA 上实现了 1.30 倍的性能提升与 4.49 倍的能效提升(峰值算力差距超过 21 倍)。
3/3/2025 12:16:48 PM
机器之心
微软削减数据中心计划并提高价格,用户需承担 AI 成本
随着大规模生成性人工智能技术的快速发展,微软近期在其产品和服务中采取了一系列引人注目的措施,以弥补巨额的运营成本。 公司不仅提高了旗下微软365软件的订阅价格,涨幅最高可达45%,还推出了带广告的产品版本,并取消了一些数据中心的租赁计划。 图源备注:图片由AI生成,图片授权服务商Midjourney微软首席执行官萨蒂亚・纳德拉最近表示,尽管公司在 AI 技术上投入了巨资,但目前为止,这些技术所带来的价值并不显著。
3/3/2025 11:42:00 AM
AI在线
消息称软银计划融资 160 亿美元加码人工智能投资
据《路透社》报道,有消息人士透露,软银集团首席执行官孙正义(Masayoshi Son)计划借款160亿美元用于人工智能(AI)投资。 此消息源于《信息》技术新闻网站,报道中提到公司高管在上周与银行的会谈中确认了这一意向。 孙正义的这一决策标志着软银在 AI 领域的持续扩展,尤其是在全球科技竞争日益激烈的背景下。
3/3/2025 11:34:00 AM
AI在线
字节跳动AI编程产品Trae国内版发布 配置豆包1.5pro、满血版DeepSeek模型
2025年3月3日,中国首款AI原生集成开发环境(AI IDE)Trae国内版正式上线。 该产品由字节跳动技术团队推出,旨在为开发者提供更高效、智能化的编程体验。 Trae国内版配置了Doubao-1.5-pro,并支持切换满血版DeepSeek R1、V3模型,能够显著提升编程速度,助力开发者应对复杂技术挑战。
3/3/2025 11:19:00 AM
AI在线
GPT-4.5成本激增,性能提升却有限,OpenAI面临性价比困境
近日,科技媒体 The Decoder 发布了一篇有关 OpenAI 最新模型 GPT-4.5的报道,内容引发了业界对该模型的性价比质疑。 根据官方数据显示,尽管 GPT-4.5在性能上有所提升,但相较于前一版本 GPT-4o,其成本却大幅增加。 具体而言,GPT-4.5在多个方面的表现优于 GPT-4o 的比例分别为:专业查询63.2%、日常查询57% 以及创意任务56.8%。
3/3/2025 11:05:00 AM
AI在线
超越DeepSeek-R1!阿里万相大模型登上全球开源榜首
今日,阿里巴巴股价在盘初阶段出现拉升,一度上涨超过4%,报价达到133.1港元。 这一市场表现与近期阿里巴巴在人工智能领域取得的显著进展密切相关。 据开源社区Hugging Face最新发布的榜单显示,阿里巴巴推出的万相大模型在开源仅6天后,便成功超越了DeepSeek-R1,一举登上了模型热榜和模型空间榜两大重要榜单的榜首。
3/3/2025 10:32:00 AM
AI在线