Extração de Documentos no Open WebUI

O Open WebUI fornece capacidades poderosas de extração de documentos que permitem processar e analisar vários tipos de documentos dentro dos seus fluxos de trabalho RAG (Geração Incrementada pela Recuperação). A extração de documentos é essencial para transformar o conteúdo não estruturado de documentos em dados estruturados que podem ser utilizados de forma eficaz por modelos de linguagem.

O que é Extração de Documentos?

A extração de documentos refere-se ao processo de identificar e extrair automaticamente texto e dados de vários formatos de arquivo, incluindo:

PDFs (baseados em texto e digitalizados)
Imagens contendo texto
Documentos manuscritos
E mais

Com uma extração adequada de documentos, o Open WebUI pode ajudá-lo a:

Converter documentos baseados em imagens em texto pesquisável
Preservar a estrutura e as informações de layout dos documentos
Extrair dados em formatos estruturados para processamento adicional
Suportar o reconhecimento de conteúdo multilíngue

Métodos de Extração Disponíveis

O Open WebUI suporta vários motores de extração de documentos para atender diferentes necessidades e tipos de documentos. Cada método de extração tem suas próprias forças e é adequado para diferentes cenários.

Explore a documentação de cada método de extração disponível para aprender como configurá-lo e usá-lo efetivamente com sua instância do Open WebUI.

O que é Extração de Documentos?​

Métodos de Extração Disponíveis​

O que é Extração de Documentos?

Métodos de Extração Disponíveis