探索 RAG 在开发复杂 LLM 中的作用。 在 2022 年之前,如果你想快速回忆起你最喜欢的书中的某个特定段落或你刚刚看过的电影中的一句话,而作品本身却没有在你面前,你可能会求助于搜索引擎。你会用一个精心设计的搜索输入来提示它,解析返回的结果,访问似乎包含你的答案的SparkNotes或IMDB链接,并在几分钟内在页面上找到你要找的文本。现在,你只需打开ChatGPT,输入“最著名的终结者名言是什么?”或“写出《双城记》的开场白”,几秒钟内就能得到逐字回复。 大型语言模型 (LLM) 最简单的用途之一是作为知识数据库。LLM 已经在包含大量丰富信息的数据集上进行了训练,ChatGPT 等界面使其易于检索。例如,当您提示 ChatGPT 从电影或书籍中返回内容时,您只是在利用模型回忆其在训练期间接触到的信息的能力。但是,如果它没有按照《终结者》的剧本进行训练,或者它的权重不重视狄更斯的作品呢?为了提供最准确和最相关的结果,即使是最简单的用例,如基本信息检索,LLM需要复杂的索引和检索机制,可以精确地访问广泛的信息。了解 LLM 内容生成和培训LLM 内容是通过称为下一个标记预测...