Перейти к основному содержимому

🗨️ Kokoro Web - Лёгкое TTS для Open WebUI

warning

Этот учебник представлен сообществом и не поддерживается командой Open WebUI. Он служит только в качестве демонстрации того, как настроить Open WebUI под ваши конкретные нужды. Хотите внести свой вклад? Ознакомьтесь с учебником по вкладу.

Что такое Kokoro Web?

Kokoro Web предоставляет лёгкий API, совместимый с OpenAI, для мощной модели преобразования текста в речь Kokoro-82M, легко интегрируя её с Open WebUI для улучшения ваших AI разговоров естественно звучащими голосами.

🚀 Интеграция в два шага

1. Разверните Kokoro Web API (одной командой)

services:
kokoro-web:
image: ghcr.io/eduardolat/kokoro-web:latest
ports:
- "3000:3000"
environment:
# Замените на любой секретный ключ для использования в качестве API ключа, совместимого с OpenAI
- KW_SECRET_API_KEY=your-api-key
volumes:
- ./kokoro-cache:/kokoro/cache
restart: unless-stopped

Запустите с помощью: docker compose up -d

2. Подключите OpenWebUI (30 секунд)

  1. В OpenWebUI перейдите в Admin PanelSettingsAudio
  2. Настройте:
    • Двигатель преобразования текста в речь: OpenAI
    • Базовый URL для API: http://localhost:3000/api/v1
      (Если используете Docker: http://host.docker.internal:3000/api/v1)
    • API ключ: your-api-key (из шага 1)
    • Модель TTS: model_q8f16 (лучший баланс размера и качества)
    • Голос TTS: af_heart (умолчание: теплый, естественный английский голос). Вы можете изменить голос на любой другой или использовать формулу из Kokoro Web Demo

Вот и всё! Ваш OpenWebUI теперь поддерживает возможности AI голосов.

🌍 Поддерживаемые языки

Kokoro Web поддерживает 8 языков со специфическими голосами, оптимизированными для каждого из них:

  • Английский (США) - en-us
  • Английский (Великобритания) - en-gb
  • Японский - ja
  • Китайский - cmn
  • Испанский - es-419
  • Хинди - hi
  • Итальянский - it
  • Португальский (Бразилия) - pt-br

Каждый язык имеет выделенные голоса для оптимального произношения и естественного звучания. См. полный список голосов на репозитории GitHub или используйте Kokoro Web Demo, чтобы мгновенно просмотреть и создать свои собственные пользовательские голоса.

💾 Оптимизированные модели для любого оборудования

Выберите модель, которая соответствует вашим потребностям в аппаратном обеспечении:

ID моделиОптимизацияРазмерЛучше всего подходит для
model_q8f16Смешанная точность86 MBРекомендуется - Лучший баланс
model_quantized8-бит92.4 MBХорошая производительность на CPU
model_uint8f16Смешанная точность114 MBЛучшее качество на средних CPU
model_q4f164-бит & fp16 веса154 MBБолее высокое качество, всё ещё эффективно
model_fp16fp16163 MBКачество премиум
model_uint88-бит & смешанная177 MBСбалансированный вариант
model_q44-бит matmul305 MBВысокое качество
modelfp32326 MBМаксимальное качество (медленнее)

✨ Попробуйте перед установкой

Посетите Kokoro Web Demo, чтобы мгновенно просмотреть все голоса. Этот демо:

  • Работает на 100% в вашем браузере - Сервер не требуется
  • Бесплатно навсегда - Нет ограничений на использование или обязательной регистрации
  • Никакой установки - Просто зайдите на сайт и начните создавать
  • Все функции включены - Протестируйте любой голос или язык немедленно

Нужна дополнительная помощь?

Для дополнительных опций, руководств по настройке голосов и расширенных настроек посетите репозиторий GitHub.

Наслаждайтесь естественными AI голосами в ваших разговорах OpenWebUI!