注意
本教程是社群貢獻,並未獲得 Open WebUI 團隊的支援。它僅作為如何為您的特定使用案例自訂 Open WebUI 的示範。想要貢獻?請參閱貢獻教程。
將openedai-speech
整合進 Open WebUI,使用 Docker
什麼是 openedai-speech
?
資訊
openedai-speech 是符合 OpenAI 音頻/語音 API 的文字轉語音伺服器。
它提供/v1/audio/speech
端點,並提供免費、私人化的文字轉語音體驗,支持自訂語音克隆功能。此服務與 OpenAI 無關,也不需要 OpenAI API 密鑰。
需求條件
- 系統已安裝 Docker
- Open WebUI 在 Docker 容器中運行
- 基本的 Docker 和 Docker Compose 使用知識
選項 1: 使用 Docker Compose
步驟 1: 為 openedai-speech
服務建立新資料夾
建立一個新資料夾,例如openedai-speech-service
,用來存放docker-compose.yml
和speech.env
檔案。
步驟 2: 從 GitHub 克隆 openedai-speech
儲存庫
git clone https://github.com/matatonic/openedai-speech.git
這將把openedai-speech
儲存庫下載到您的本地機器,其中包含 Docker Compose 檔案(docker-compose.yml
,docker-compose.min.yml
和docker-compose.rocm.yml
)及其他必要檔案。
步驟 3: 將sample.env
檔案重新命名為speech.env
(根據需要進行自訂)
在openedai-speech
儲存庫資料夾中,建立一個名為speech.env
的新檔案,內容如下:
TTS_HOME=voices
HF_HOME=voices
#PRELOAD_MODEL=xtts
#PRELOAD_MODEL=xtts_v2.0.2
#PRELOAD_MODEL=parler-tts/parler_tts_mini_v0.1
#EXTRA_ARGS=--log-level DEBUG --unload-timer 300
#USE_ROCM=1
步驟 4: 選擇 Docker Compose 檔案
您可以使用以下任何一個 Docker Compose 檔案:
- docker-compose.yml: 此檔案使用
ghcr.io/matatonic/openedai-speech
映像並基於Dockerfile進行構建。 - docker-compose.min.yml: 此檔案使用
ghcr.io/matatonic/openedai-speech-min
映像並基於Dockerfile.min進行構建。該映像是最小版本,只支持 Piper,不需要 GPU。- docker-compose.rocm.yml: 此檔案使用
ghcr.io/matatonic/openedai-speech-rocm
映像,並基於 Dockerfile以支援 ROCm。
- docker-compose.rocm.yml: 此檔案使用
步驟 4: 建立所選的 Docker 映像
在運行 Docker Compose 檔案之前,您需要建立 Docker 映像:
- Nvidia GPU(支持 CUDA):
docker build -t ghcr.io/matatonic/openedai-speech .
- AMD GPU(支持 ROCm):
docker build -f Dockerfile --build-arg USE_ROCM=1 -t ghcr.io/matatonic/openedai-speech-rocm .
- 僅使用 CPU,無 GPU(僅支持 Piper):
docker build -f Dockerfile.min -t ghcr.io/matatonic/openedai-speech-min .
步驟 5: 運行正確的docker compose up -d
命令
- Nvidia GPU(支持 CUDA):運行以下命令以脫離模式啟動
openedai-speech
服務:
docker compose up -d
- AMD GPU(支持 ROCm):運行以下命令以脫離模式啟動
openedai-speech
服務:
docker compose -f docker-compose.rocm.yml up -d