Extracción de Documentos en Open WebUI

Open WebUI ofrece potentes capacidades de extracción de documentos que te permiten procesar y analizar varios tipos de documentos dentro de tus flujos de trabajo RAG (Generación Aumentada por Recuperación). La extracción de documentos es esencial para transformar contenido no estructurado en datos estructurados que puedan ser utilizados efectivamente por modelos de lenguaje.

¿Qué es la Extracción de Documentos?

La extracción de documentos se refiere al proceso de identificar y extraer automáticamente texto y datos de varios formatos de archivo, incluyendo:

PDFs (tanto basados en texto como escaneados)
Imágenes que contienen texto
Documentos manuscritos
Y más

Con una extracción adecuada de documentos, Open WebUI puede ayudarte a:

Convertir documentos basados en imágenes a texto que se pueda buscar
Preservar la estructura y la información de diseño del documento
Extraer datos en formatos estructurados para un procesamiento posterior
Soportar reconocimiento de contenido multilingüe

Métodos de Extracción Disponibles

Open WebUI admite múltiples motores de extracción de documentos para adaptarse a diferentes necesidades y tipos de documentos. Cada método de extracción tiene sus propias fortalezas y es adecuado para diferentes escenarios.

Explora la documentación para cada método de extracción disponible para aprender cómo configurarlo y usarlo efectivamente con tu instancia de Open WebUI.

¿Qué es la Extracción de Documentos?​

Métodos de Extracción Disponibles​

¿Qué es la Extracción de Documentos?

Métodos de Extracción Disponibles