🔎 检索增强生成 (RAG)
如果您正在使用 Ollama,请注意它的默认上下文长度为2048个标记。这意味着检索到的数据可能完全无法使用,因为它不符合可用的上下文窗口。为了提高检索增强生成 (RAG) 的性能,您应该在 Ollama 模型设置中将上下文长度增加到 8192+ 个标记。
检索增强生成 (RAG) 是一种尖端技术,通过结合来自多种来源的上下文来增强聊天机器人的对话能力。它通过从本地和远程文档、网页内容,甚至是像 YouTube 视频这样的多媒体来源中检索相关信息来工作。检索到的文本会与预定义的 RAG 模板结合,并被前置到用户的提示中,从而提供更具信息性和上下文相关的响应。
RAG 的一个主要优势是能够访问和整合来自多种来源的信息,使其成为复杂对话场景的理想解决方案。例如,当用户提出与特定文档或网页内容相关的问题时,RAG 可以从该来源检索相关信息并将其整合到聊天响应中。RAG 还可以从多媒体来源(如 YouTube 视频)中检索和整合信息。通过分析这些视频的转录或字幕,RAG 可以提取出相关信息并将其整合到聊天响应中。
本地和远程 RAG 集成
本地文档必须首先通过工作区区域的 Documents 部分上传,以便在查询时通过 #
符号访问它们。点击聊天框上方出现的格式化 URL。一旦选择,文档图标将出现在 发送消息
上方,表示检索成功。
您还可以通过以 #
开头并跟随一个 URL 的方式加载文档到工作区区域。这可以帮助将网页内容直接整合到您的对话中。
RAG 的网页搜索
对于网页内容的整合,在聊天中以 #
开头,后跟目标 URL 发起查询。点击聊天框上方出现的格式化 URL。一旦选择,文档图标将出现在 发送消息
上方,表示检索成功。Open WebUI 会从 URL 中抓取并解析信息(如果可能)。
网页通常包含诸如导航和页脚等冗余信息。为了获得更好的结果,请链接到页面的原始或易读版本。