Aller au contenu principal

🗨️ Kokoro Web - Synthèse Vocale Simple pour Open WebUI

attention

Ce tutoriel est une contribution de la communauté et n'est pas pris en charge par l'équipe Open WebUI. Il sert uniquement de démonstration sur la personnalisation d'Open WebUI pour votre cas d'utilisation spécifique. Vous souhaitez contribuer ? Consultez le tutoriel de contribution.

Qu'est-ce que Kokoro Web ?

Kokoro Web offre une API légère, compatible avec OpenAI, pour le puissant modèle de synthèse vocale Kokoro-82M, s'intégrant facilement à Open WebUI pour enrichir vos conversations avec des voix naturelles.

🚀 Intégration en Deux Étapes

1. Déployer l'API Kokoro Web (Une Commande)

services:
kokoro-web:
image: ghcr.io/eduardolat/kokoro-web:latest
ports:
- "3000:3000"
environment:
# Changez cette clé secrète pour l'utiliser comme clé API compatible OpenAI
- KW_SECRET_API_KEY=votre-clé-api
volumes:
- ./kokoro-cache:/kokoro/cache
restart: unless-stopped

Exécutez avec : docker compose up -d

2. Connecter OpenWebUI (30 Secondes)

  1. Dans OpenWebUI, allez à Panneau AdministrateurParamètresAudio
  2. Configurez :
    • Moteur de Synthèse Vocale : OpenAI
    • URL de base de l'API : http://localhost:3000/api/v1 (Si vous utilisez Docker : http://host.docker.internal:3000/api/v1)
    • Clé API : votre-clé-api (de l'étape 1)
    • Modèle TTS : model_q8f16 (meilleur équilibre taille/qualité)
    • Voix TTS : af_heart (voix anglaise chaleureuse et naturelle par défaut). Vous pouvez la changer pour une autre voix ou formule disponible dans la Démo Kokoro Web

C'est tout ! Votre OpenWebUI dispose désormais de capacités vocales via l'IA.

🌍 Langues Prises en Charge

Kokoro Web prend en charge 8 langues avec des voix spécifiques optimisées pour chacune :

  • Anglais (US) - en-us
  • Anglais (UK) - en-gb
  • Japonais - ja
  • Chinois - cmn
  • Espagnol - es-419
  • Hindi - hi
  • Italien - it
  • Portugais (Brésil) - pt-br

Chaque langue dispose de voix dédiées pour une prononciation optimale et un débit naturel. Consultez le repository GitHub pour la liste complète des voix spécifiques par langue ou utilisez la Démo Kokoro Web pour prévisualiser et créer vos propres voix personnalisées instantanément.

💾 Modèles Optimisés pour Tout Matériel

Choisissez le modèle qui répond à vos besoins matériels :

ID du ModèleOptimisationTailleIdéal pour
model_q8f16Précision mixte86 MBRecommandé - Meilleur équilibre
model_quantized8-bit92.4 MBBonne performance CPU
model_uint8f16Précision mixte114 MBQualité supérieure sur CPU moyen de gamme
model_q4f16Poids 4-bit & fp16154 MBQualité supérieure, toujours efficace
model_fp16fp16163 MBQualité premium
model_uint88-bit & mixte177 MBOption équilibrée
model_q4matmul 4-bit305 MBOption haute qualité
modelfp32326 MBQualité maximale (plus lent)

✨ Essayez Avant d'Installer

Visitez la Démo Kokoro Web pour prévisualiser toutes les voix instantanément. Cette démo :

  • Fonctionne entièrement dans votre navigateur - Aucun serveur requis
  • Gratuit pour toujours - Sans limites d'utilisation ni inscription requise
  • Sans installation - Visitez simplement le site web et commencez à créer
  • Toutes les fonctionnalités incluses - Testez n'importe quelle voix ou langue immédiatement

Besoin de Plus d'Aide ?

Pour des options supplémentaires, des guides de personnalisation vocale, et des paramètres avancés, visitez le repository GitHub.

Profitez de voix d'IA naturelles dans vos conversations OpenWebUI !