没有思考过 Embedding，谈何 RAG，更不足以谈 AI大模型

作者：渔夫 2024-11-21 03:44

今天，我们来聊聊 AI 大模型，有一个非常重要概念 "Embedding"。你可能听说过它，也可能对它一知半解。如果你没有深入了解过 Embedding，那你就无法真正掌握 RAG 技术，更不能掌握 AI 大模型精髓所在。

1.什么是大语言模型（LLM）？

LLM 是一种大型语言模型，是一种用于理解、生成和响应类人文本的神经网络，这些模型是在大量文本数据上训练的深度神经网络。

大型语言模型中的“大”指的是模型在参数方面的大小和它所训练的庞大数据集。这样的模型通常有数百亿甚至数千亿个参数，这些参数是网络中可调整的权重，在训练过程中进行优化，以预测序列中的下一个单词。

没有思考过 Embedding，谈何 RAG，更不足以谈 AI大模型

模型微调，是指在预训练模型的基础上，使用特定任务的标注数据进行进一步训练，使模型能够完成特定的任务。

其特点，建立在预训练基础上，利用预训练模型已经学到的语言知识，不需要从零开始训练。这样有助于降低训练的成本，以及缩短训练时间，能更好快速适应新任务。

2.Embedding 的理解

深度学习模型不能处理原始形式的视频、音频和文本等数据格式。那怎么办？因此，我们引入了 “embedding“ ，翻译为“嵌入“ 。

专业术语来讲，Embedding 是一种将离散数据（如文字、图像、音频等）转换为连续的密集向量表示的技术，这些向量能够反映原始数据之间的关系。

现在，很多企业搭建本地知识库，常提到的 RAG 技术，实际上用 Embedding 模型作为基础工具，来将查询的词转换为向量。

Embedding 是 RAG 的基础工具，而 RAG 是 Embedding 的一种应用场景，这样就得到一个公式：RAG = Embedding + 检索 + LLM生成。

如果，你还想更深层次去理解 Embedding 底层细节原理，建议你去学习或了解相关数学概念，如向量空间、线性代数、矩阵、特征值和特征向量和内积和外积等。

今天，这篇文章主要是讲大致流程概念，知道这么回事，并没有过多的深入讲解。

3.RAG 又是什么？

RAG 是检索增强生成（Retrieval-Augmented Generation）的缩写，它通过结合检索系统和生成模型来提高语言生成的准确性和相关性。

RAG 优势就是能够在生成响应时引入外部知识，使得生成的内容更加准确，也无需训练。很好解决 LLM 面临数据实时性问题，因为 LLM 训练是有时截止日期的。

目前，很多企业搭建自己知识库时，都是采用 RAG 技术进行信息检索。然而为了达到更好效果，企业一般也会进行内部模型微调 Embedding Model，来增加检索增强生成的能力。

大模型中的嵌入向量

前面文章和小伙伴们聊了 Tokenizer，经过 Tokenizer 之后，自然语言变为 Token，那么大模型就可以直接训练 Token 了嘛？还不行！接下来还有一个词嵌入的环境，英文就是 Embedding，Embedding 实际上就是将 Token 转为张量，在有的场景下，Embedding 也指张量本身。

7/30/2025 4:15:00 AM

江南一点雨

击败OpenAI，权重、数据、代码全开源，能完美复现的嵌入模型Nomic Embed来了

模型参数量只有 137M，5 天就能训练好。一周前，OpenAI 给广大用户发放福利，在下场修复 GPT-4 变懒的问题后，还顺道上新了 5 个新模型，其中就包括更小且高效的 text-embedding-3-small 嵌入模型。我们知道，嵌入是表示自然语言或代码等内容中概念的数字序列。嵌入使得机器学习模型和其他算法更容易理解内容之间的关联，也更容易执行聚类或检索等任务。可见，嵌入在 NLP 领域是非常重要的。不过，OpenAI 的嵌入模型并不是免费给大家使用的，比如 text-embedding-3-small

2/4/2024 3:31:00 PM

机器之心

该更新啦！6款超好用的SDXL负面提示词Embedding模型

大家好我是花生~ SDXL 1.0 模型发布以来，优质的 SDXL 大模型不断涌现，让图像的生成质量越来越高。但版本迭代后，之前的 SD1.5 的负面提示词 Embedding 并不能和 SDXL 大模型配合使用，而每次都输入一大串的反向提示词又实在麻烦。所以今天就继续给大家推荐 6 款可以配合 SDXL 模型使用的负面提示词 Embedding，它们可以在 SD WebUI 和 ComfyUI 中使用，能有效修复图像缺陷，提升画面细节和质感。上期回顾：一、UnaestheticXL 链接直达：（文末有资源包

11/17/2023 8:28:39 AM

夏花生

没有思考过 Embedding，谈何 RAG，更不足以谈 AI大模型

1.什么是大语言模型（LLM）？

2.Embedding 的理解

3.RAG 又是什么？

相关资讯

大模型中的嵌入向量

击败OpenAI，权重、数据、代码全开源，能完美复现的嵌入模型Nomic Embed来了

该更新啦！6款超好用的SDXL负面提示词Embedding模型