跳至主要内容

Open WebUI 中的文件提取

Open WebUI 提供強大的文件提取功能,讓您能在 RAG(檢索輔助生成)工作流程中處理和分析各種類型的文件。文件提取對於將非結構化的文件內容轉化為可以被語言模型有效使用的結構化數據至關重要。

什麼是文件提取?

文件提取是指自動識別並從各種文件格式中提取文本和數據的過程,包括:

  • PDF 文件(包含文字類型和掃描類型)
  • 含文字的圖片
  • 手寫文件
  • 以及更多

透過正確的文件提取方式,Open WebUI 可以幫助您:

  • 將基於圖片的文件轉換為可搜索的文字
  • 保留文件結構和佈局資訊
  • 以結構化格式提取數據進行進一步處理
  • 支援多語言內容識別

可用的提取方法

Open WebUI 支援多種文件提取引擎,以滿足不同需求和文件類型的需要。每種提取方法都有其自身的特點,適用於不同的場景。

查看每種可用提取方法的文件以了解如何進行設置並有效使用它們與您的 Open WebUI 實例。