大模型

RAG检索全攻略：Embedding与Rerank模型的终极指南

在构建基于检索增强生成（RAG）的系统时，Embedding Model和Rerank Model扮演着至关重要的角色。比如你正在搭建一个智能搜索引擎，Embedding Model就像是帮你快速找到相关书籍的“图书管理员”，而Rerank Model则像是一位经验丰富的“资深书评人”，负责从一堆书里精准挑选出最符合你需求的那几本。两者配合，就像一对完美搭档，确保RAG系统既能找到大量信息，又能精准提炼出最关键的内容。

3/26/2025 11:05:13 AM

传神语联发布深度思考大模型-T1：根原创铸基，任度双脑开启AI深度思考新高度

2025年3月24日，传神语联A纪元系列线上发布活动的第一天，传神语联重磅发布任度双脑深度思考大模型-T1（以下简称任度大模型-T1），为大模型领域贡献了又一创新性成果。那么，你或许会好奇，在大模型层出不穷的今天，传神语联为什么还执着于推出大模型？底气来自哪里？

3/25/2025 5:59:13 PM

Google AI Studio 现可通过 ai.dev 域名直接访问

谷歌今日宣布，其备受开发者欢迎的在线平台 Google AI Studio 迎来重要更新，现已正式启用全新且更易于记忆的域名 ai.dev。开发者可以通过此快捷地址轻松访问这一强大的工具，探索和构建各种生成式人工智能应用。 Google AI Studio 最初旨在为开发者提供一个无需复杂环境搭建即可快速上手体验和利用谷歌最新 AI 模型（如 Gemini 系列）的平台。

3/25/2025 9:45:00 AM

AI在线

大神卡帕西亲自演绎零基础开发APP，ChatGPT四轮对话搞定，一小时即在手机运行

大神卡帕西带着他的教程又来了！这次不是教学视频，而是手把手教你如何用大模型开发APP——他没有阅读任何文档，也没有在专门平台Swift编程过，在与ChatGPT仅四轮对话的指导下，成功在手机上运行上了。，时长00:24这是个用来减肥跟踪APP。

3/25/2025 9:43:03 AM

量子位

三种RAG部署方案：自购GPU硬件 vs 大模型一体机 vs 云端GPU

春节以后这一个半月，算了下我前后也做了 20 的企业知识库落地咨询，其中无论是线上还是线下，被问到最多的一个问题是：要快速落地本地部署的知识库，应该购买什么硬件？要回答这个问题，其实需要明确很多前置定语，自购 GPU 硬件、大模型一体机、以及选择云端 GPU 都有各自适用的情形。这篇试图说清楚三种部署方式的主要特点对比，并在文末给些选择建议参考。

3/24/2025 1:17:11 PM

韦东东

谷歌正在推出 Gemini 实时人工智能视频功能

谷歌发言人亚历克斯・约瑟夫在给 The Verge 的一封电子邮件中证实，谷歌已开始向 Gemini Live 推出新的人工智能功能，这些功能使其能够“看到”你的屏幕内容，或者通过你的智能手机摄像头获取画面，并实时回答与之相关的问题。

3/24/2025 8:08:39 AM

浩渺

AMD 推出开源项目“GAIA”实现本地大模型高效运行：针对锐龙 AI 300 系列处理器优化，目前仅适用于 Windows

在 NPU 上运行 GAIA 可提高 AI 特定任务的性能。从 Ryzen AI 软件版本 1.3 开始，混合支持部署同时使用 NPU 和核显的量化 LLM。

3/22/2025 1:27:09 PM

问舟

Soul App实时人像视频生成研究成果获国际学术顶会CVPR2025录用

近期，IEEE国际计算机视觉与模式识别会议（ Conference on Computer Vision and Pattern Recognition）CVPR 2025公布论文录用结果，社交平台Soul App技术论文《Teller: Real-Time Streaming Audio-Driven Portrait Animation with Autoregressive Motion Generation》（《基于自回归动作生成的实时流式音频驱动人像动画系统》）被接收。 Soul App团队在论文中提出了一个新的面向实时音频驱动人像动画（即Talking Head）的自回归框架，解决了视频画面生成耗时长的行业挑战外，还实现了说话时头部生成以及人体各部位运动的自然性和逼真性。此次论文的入选，也证明了Soul App在推动多模态能力构建特别是视觉层面能力突破上取得了阶段性成果。

3/21/2025 5:14:00 PM

新闻助手

RAG（五）BGE-M3，最流行的开源text embedding模型

项目地址： embedding？ Text Embedding 是一种将文本数据映射到高维向量空间的技术，这些向量能够捕捉文本的语义信息。通过将文本嵌入到向量空间中，我们可以利用向量之间的距离或相似性来衡量文本之间的语义相关性。

3/21/2025 7:00:00 AM

Glodma

被低估的谷歌？聊聊Gemini 2.0最近3个超酷的新功能

Google 最近的动作真的多。感觉就是趁着 OpenAI 存粮打完了，疯狂的撒豆子一样往外面撒更新。昨天晚上 11 点多，他们又发了一个关于 Gemini 的更新（其实功能礼拜天就上了，我也不知道他们为啥今天才发推文）。

3/21/2025 12:11:04 AM

数字生命卡兹克

支持大模型百花齐放，推进全面智能化战略：华为中国合作伙伴大会2025召开

华为正计划今年在计算产业伙伴中将重点发展 IT 类伙伴，包括构建计算经销商伙伴体系，并新增大模型一体机伙伴，计划今年发展十几家大模型伙伴。

3/20/2025 5:17:00 PM

新闻助手

上海浦东聚焦人形机器人与大模型技术，力图打造创新产业园区

近日，上海浦东新区召开了一场市政府新闻发布会，副区长李慧在会上表示，浦东将全面发力，聚焦人形机器人、大模型以及生物制造等前沿科技领域，致力于构建一批具有特色的产业园区地标。这一举措不仅展现了浦东在全球投资环境中的战略眼光，也为未来的科技创新奠定了坚实的基础。李慧指出，浦东将加强与企业的沟通，了解市场需求，以强化各类要素的支持。

3/20/2025 4:53:00 PM

AI在线

阶跃星辰 Step-Video-TI2V 图生视频模型开源：运动幅度和镜头运动可控

今年 2 月阶跃星辰开源了两款 Step 系列多模态大模型 ——Step-Video-T2V 视频生成模型和 Step-Audio 语音模型，今天阶跃星辰继续开源图生视频模型 ——Step-Video-TI2V，一款基于 30B 参数 Step-Video-T2V 训练的图生视频模型，支持生成 102 帧、5 秒、540P 分辨率的视频，具备运动幅度可控和镜头运动可控两大核心特点，同时天生具备一定的特效生成能力。

3/20/2025 3:19:58 PM

远洋

谷歌Chrome浏览器即将整合Gemini AI助手，操作更便捷！

在互联网科技的快速发展中，谷歌 Chrome 浏览器又将迎来一项重要更新。根据科技媒体 Windows Latest 的最新消息，谷歌计划将其 Gemini 人工智能助手深度整合进 Chrome 浏览器，这一举措将让用户享受到更便捷的在线体验。 Gemini AI 助手的整合将类似于微软 Edge 浏览器中的 C opilot 功能。

3/20/2025 2:07:00 PM

AI在线

Google Chrome即将集成Gemini AI，助力浏览体验再升级

谷歌正在积极将其最新的 AI 助手 Gemini 整合到 Chrome 浏览器中，旨在为用户提供更加智能和便捷的浏览体验。这一功能的引入，类似于微软 Edge 浏览器中的 C opilot，但 Google 对其进行了独特的设计。根据浏览器研究员 Leopeva64的分析，当前在 Chrome Canary（谷歌浏览器的实验版）中，Gemini AI 助手已经有了初步的雏形。

3/20/2025 10:40:00 AM

AI在线

三星重磅官宣！One UI 7携AI超能力4月7日全球启动更新，你的手机准备好了吗？

三星粉丝们注意了!这家科技巨头正式宣布，基于Android15的最新手机操作系统One UI7即将登场，并将于4月7日起在全球范围内陆续推送至现有手机和平板电脑。美国地区的用户稍作等待，更新将于4月10日开始推送。在美国，首批尝鲜One UI7的将是三星2024年的旗舰机型Galaxy S24系列，以及备受期待的折叠屏手机Fold6和Flip6。

3/19/2025 5:56:00 PM

AI在线