Aller au contenu principal

Extraction de Documents dans Open WebUI

Open WebUI offre des capacités puissantes d'extraction de documents qui vous permettent de traiter et d'analyser divers types de documents dans vos flux de travail RAG (génération augmentée par la récupération). L'extraction de documents est essentielle pour transformer le contenu des documents non structurés en données structurées pouvant être efficacement utilisées par les modèles de langage.

Qu'est-ce que l'Extraction de Documents ?

L'extraction de documents fait référence au processus d'identification et d'extraction automatique de texte et de données à partir de divers formats de fichiers, y compris :

  • PDFs (à la fois basés sur du texte et numérisés)
  • Images contenant du texte
  • Documents manuscrits
  • Et plus encore

Avec une extraction de documents appropriée, Open WebUI peut vous aider à :

  • Convertir des documents basés sur des images en texte consultable
  • Préserver la structure des documents et les informations de mise en page
  • Extraire des données dans des formats structurés pour un traitement ultérieur
  • Soutenir la reconnaissance de contenu multilingue

Méthodes d'Extraction Disponibles

Open WebUI prend en charge plusieurs moteurs d'extraction de documents pour répondre à différents besoins et types de documents. Chaque méthode d'extraction a ses propres atouts et est adaptée à différents scénarios.

Explorez la documentation de chaque méthode d'extraction disponible pour apprendre à la configurer et à l'utiliser efficacement avec votre instance Open WebUI.