🗨️ Конфигурация
Open Web UI поддерживает локальную, браузерную и удалённую речь в текст.
Облачные / Удалённые провайдеры преобразования речи в текст
В настоящее время поддерживаются следующие облачные провайдеры преобразования речи в текст. Ключи API могут быть настроены как переменные окружения (OpenAI) или на странице настроек администратора (оба ключа).
Сервис | Требуется API ключ |
---|---|
OpenAI | ✅ |
DeepGram | ✅ |
WebAPI предоставляет преобразование речи в текст через встроенный провайдер преобразования речи в текст в браузере.
Настройка вашего провайдера преобразования речи в текст
Чтобы настроить провайдера преобразования речи в текст:
- Перейдите в настройки администратора
- Выберите Аудио
- Укажите API ключ и выберите модель из выпадающего списка
Пользовательские настройки
Помимо настроек экземпляра, предоставляемых в панели администратора, существуют также несколько пользовательских настроек, которые могут предоставить дополнительную функциональность.
- Настройки STT: Содержат настройки, связанные с функцией преобразования речи в текст.
- Движок преобразования речи в текст: Определяет двигатель, используемый для распознавания речи (по умолчанию или Web API).
Использование STT
Преобразование речи в текст предоставляет высокоэффективный способ "написания" подсказок с помощью вашего голоса и работает надёжно как на настольных, так и на мобильных устройствах.
Чтобы использовать STT, просто нажмите на значок микрофона:
Живая звуковая волна будет указывать на успешный захват голоса:
Операция в режиме STT
Как только запись началась, вы можете:
- Нажать на значок галочки, чтобы сохранить запись (если включена отправка после завершения, запись будет отправлена на обработку; иначе её можно отправить вручную)
- Если вы хотите отменить запись (например, начать заново), вы можете нажать на значок x, чтобы выйти из интерфейса записи