Pular para o conteúdo principal

Extração de Documentos no Open WebUI

O Open WebUI fornece capacidades poderosas de extração de documentos que permitem processar e analisar vários tipos de documentos dentro dos seus fluxos de trabalho RAG (Geração Incrementada pela Recuperação). A extração de documentos é essencial para transformar o conteúdo não estruturado de documentos em dados estruturados que podem ser utilizados de forma eficaz por modelos de linguagem.

O que é Extração de Documentos?

A extração de documentos refere-se ao processo de identificar e extrair automaticamente texto e dados de vários formatos de arquivo, incluindo:

  • PDFs (baseados em texto e digitalizados)
  • Imagens contendo texto
  • Documentos manuscritos
  • E mais

Com uma extração adequada de documentos, o Open WebUI pode ajudá-lo a:

  • Converter documentos baseados em imagens em texto pesquisável
  • Preservar a estrutura e as informações de layout dos documentos
  • Extrair dados em formatos estruturados para processamento adicional
  • Suportar o reconhecimento de conteúdo multilíngue

Métodos de Extração Disponíveis

O Open WebUI suporta vários motores de extração de documentos para atender diferentes necessidades e tipos de documentos. Cada método de extração tem suas próprias forças e é adequado para diferentes cenários.

Explore a documentação de cada método de extração disponível para aprender como configurá-lo e usá-lo efetivamente com sua instância do Open WebUI.