Перейти к основному содержимому

🗨️ Конфигурация

Open Web UI поддерживает локальную, браузерную и удалённую речь в текст.

alt text

alt text

Облачные / Удалённые провайдеры преобразования речи в текст

В настоящее время поддерживаются следующие облачные провайдеры преобразования речи в текст. Ключи API могут быть настроены как переменные окружения (OpenAI) или на странице настроек администратора (оба ключа).

СервисТребуется API ключ
OpenAI
DeepGram

WebAPI предоставляет преобразование речи в текст через встроенный провайдер преобразования речи в текст в браузере.

Настройка вашего провайдера преобразования речи в текст

Чтобы настроить провайдера преобразования речи в текст:

  • Перейдите в настройки администратора
  • Выберите Аудио
  • Укажите API ключ и выберите модель из выпадающего списка

alt text

Пользовательские настройки

Помимо настроек экземпляра, предоставляемых в панели администратора, существуют также несколько пользовательских настроек, которые могут предоставить дополнительную функциональность.

  • Настройки STT: Содержат настройки, связанные с функцией преобразования речи в текст.
  • Движок преобразования речи в текст: Определяет двигатель, используемый для распознавания речи (по умолчанию или Web API).

alt text

Использование STT

Преобразование речи в текст предоставляет высокоэффективный способ "написания" подсказок с помощью вашего голоса и работает надёжно как на настольных, так и на мобильных устройствах.

Чтобы использовать STT, просто нажмите на значок микрофона:

alt text

Живая звуковая волна будет указывать на успешный захват голоса:

alt text

Операция в режиме STT

Как только запись началась, вы можете:

  • Нажать на значок галочки, чтобы сохранить запись (если включена отправка после завершения, запись будет отправлена на обработку; иначе её можно отправить вручную)
  • Если вы хотите отменить запись (например, начать заново), вы можете нажать на значок x, чтобы выйти из интерфейса записи

alt text