🗨️ Kokoro Web - Лёгкое TTS для Open WebUI
Этот учебник представлен сообществом и не поддерживается командой Open WebUI. Он служит только в качестве демонстрации того, как настроить Open WebUI под ваши конкретные нужды. Хотите внести свой вклад? Ознакомьтесь с учебником по вкладу.
Что такое Kokoro Web
?
Kokoro Web предоставляет лёгкий API, совместимый с OpenAI, для мощной модели преобразования текста в речь Kokoro-82M, легко интегрируя её с Open WebUI для улучшения ваших AI разговоров естественно звучащими голосами.
🚀 Интеграция в два шага
1. Разверните Kokoro Web API (одной командой)
services:
kokoro-web:
image: ghcr.io/eduardolat/kokoro-web:latest
ports:
- "3000:3000"
environment:
# Замените на любой секретный ключ для использования в качестве API ключа, совместимого с OpenAI
- KW_SECRET_API_KEY=your-api-key
volumes:
- ./kokoro-cache:/kokoro/cache
restart: unless-stopped
Запустите с помощью: docker compose up -d
2. Подключите OpenWebUI (30 секунд)
- В OpenWebUI перейдите в
Admin Panel
→Settings
→Audio
- Настройте:
- Двигатель преобразования текста в речь:
OpenAI
- Базовый URL для API:
http://localhost:3000/api/v1
(Если используете Docker:http://host.docker.internal:3000/api/v1
) - API ключ:
your-api-key
(из шага 1) - Модель TTS:
model_q8f16
(лучший баланс размера и качества) - Голос TTS:
af_heart
(умолчание: теплый, естественный английский голос). Вы можете изменить голос на любой другой или использовать формулу из Kokoro Web Demo
- Двигатель преобразования текста в речь:
Вот и всё! Ваш OpenWebUI теперь поддерживает возможности AI голосов.
🌍 Поддерживаемые языки
Kokoro Web поддерживает 8 языков со специфическими голосами, оптимизированными для каждого из них:
- Английский (США) - en-us
- Английский (Великобритания) - en-gb
- Японский - ja
- Китайский - cmn
- Испанский - es-419
- Хинди - hi
- Итальянский - it
- Португальский (Бразилия) - pt-br
Каждый язык имеет выделенные голоса для оптимального произношения и естественного звучания. См. полный список голосов на репозитории GitHub или используйте Kokoro Web Demo, чтобы мгновенно просмотреть и создать свои собственные пользовательские голоса.
💾 Оптимизированные модели для любого оборудования
Выберите модель, которая соответствует вашим потребностям в аппаратном обеспечении:
ID модели | Оптимизация | Размер | Лучше всего подходит для |
---|---|---|---|
model_q8f16 | Смешанная точность | 86 MB | Рекомендуется - Лучший баланс |
model_quantized | 8-бит | 92.4 MB | Хорошая производительность на CPU |
model_uint8f16 | Смешанная точность | 114 MB | Лучшее качество на средних CPU |
model_q4f16 | 4-бит & fp16 веса | 154 MB | Более высокое качество, всё ещё эффективно |
model_fp16 | fp16 | 163 MB | Качество премиум |
model_uint8 | 8-бит & смешанная | 177 MB | Сбалансированный вариант |
model_q4 | 4-бит matmul | 305 MB | Высокое качество |
model | fp32 | 326 MB | Максимальное качество (медленнее) |
✨ Попробуйте перед установкой
Посетите Kokoro Web Demo, чтобы мгновенно просмотреть все голоса. Этот демо:
- Работает на 100% в вашем браузере - Сервер не требуется
- Бесплатно навсегда - Нет ограничений на использование или обязательной регистрации
- Никакой установки - Просто зайдите на сайт и начните создавать
- Все функции включены - Протестируйте любой голос или язык немедленно
Нужна дополнительная помощь?
Для дополнительных опций, руководств по настройке голосов и расширенных настроек посетите репозиторий GitHub.
Наслаждайтесь естественными AI голосами в ваших разговорах OpenWebUI!