๐จ๏ธ Kokoro-FastAPI Using Docker
์ด ํํ ๋ฆฌ์ผ์ ์ปค๋ฎค๋ํฐ ๊ธฐ์ฌ๋ก ์ ๊ณต๋๋ฉฐ Open WebUI ํ์์ ์ง์ํ์ง ์์ต๋๋ค. ํน์ ์ฉ๋์ ๋ง๊ฒ Open WebUI๋ฅผ ์ฌ์ฉ์ ์ ์ํ๋ ๋ฐฉ๋ฒ์ ๋ณด์ฌ์ฃผ๋ ๋ฐ ๋ชฉ์ ์ด ์์ต๋๋ค. ๊ธฐ์ฌํ๊ณ ์ถ์ผ์ ๊ฐ์? ๊ธฐ์ฌ ํํ ๋ฆฌ์ผ์ ํ์ธํด๋ณด์ธ์.
Kokoro-FastAPI
๋ ๋ฌด์์ธ๊ฐ์?โ
Kokoro-FastAPI๋ OpenAI API ์๋ํฌ์ธํธ ์ฌ์์ ๊ตฌํํ Kokoro-82M ํ ์คํธ-์์ฑ ๋ณํ ๋ชจ๋ธ์ ์ํ Docker ๊ธฐ๋ฐ FastAPI ๋ํผ์ ๋๋ค. ๊ณ ์ ์์ฑ ์๋๋ฅผ ์ ๊ณตํ๋ฉฐ ๊ณ ์ฑ๋ฅ ํ ์คํธ-์์ฑ ๋ณํ ๊ธฐ๋ฅ์ ์๋ํฉ๋๋ค.
์ฃผ์ ๊ธฐ๋ฅโ
- OpenAI ํธํ ์์ฑ ์๋ํฌ์ธํธ์ ์ธ๋ผ์ธ ์์ฑ ๊ฒฐํฉ
- NVIDIA GPU ๊ฐ์ ๋๋ CPU Onnx ์ถ๋ก
- ๊ฐ๋ณ ์ฒญํฌ ์คํธ๋ฆฌ๋ฐ ์ง์
- ์ฌ๋ฌ ์ค๋์ค ํฌ๋งท ์ง์ (
.mp3
,.wav
,.opus
,.flac
,.aac
,.pcm
) - localhost:8880/web์์ ํตํฉ ์น ์ธํฐํ์ด์ค (๋๋ ์ ์ฅ์์ ์ถ๊ฐ ์ปจํ ์ด๋์๋ gradio ํฌํจ)
- ๋ณํ ๋ฐ ์์ฑ์ฉ ์์ ์๋ํฌ์ธํธ
์์ฑโ
- af
- af_bella
- af_irulan
- af_nicole
- af_sarah
- af_sky
- am_adam
- am_michael
- am_gurney
- bf_emma
- bf_isabella
- bm_george
- bm_lewis
์ธ์ดโ
- en_us
- en_uk
์๊ตฌ ์ฌํญโ
- ์์คํ ์ Docker ์ค์น ํ์
- Open WebUI ์คํ ์ค
- GPU ์ง์์ ๊ฒฝ์ฐ: CUDA 12.3์ด ํฌํจ๋ NVIDIA GPU
- CPU ์ ์ฉ์ ๊ฒฝ์ฐ: ํน๋ณํ ์๊ตฌ ์ฌํญ ์์
โก๏ธ ๋น ๋ฅธ ์์โ
GPU ๋๋ CPU ๋ฒ์ ์ค ์ ํํ ์ ์์ต๋๋คโ
GPU ๋ฒ์ (CUDA 12.8์ด ํ์ํ NVIDIA GPU)โ
docker run์ ์ฌ์ฉ:
docker run --gpus all -p 8880:8880 ghcr.io/remsky/kokoro-fastapi-gpu
๋๋ docker compose๋ฅผ ์ฌ์ฉํ ์ฌ docker-compose.yml
ํ์ผ์ ์์ฑํ๊ณ docker compose up
์ ์คํ: ์:
name: kokoro
services:
kokoro-fastapi-gpu:
ports:
- 8880:8880
image: ghcr.io/remsky/kokoro-fastapi-gpu:v0.2.1
restart: always
deploy:
resources:
reservations:
devices:
- driver: nvidia
count: all
capabilities:
- gpu
NVIDIA Container Toolkit์ ์ค์นํ๊ณ ๊ตฌ์ฑํด์ผ ํ ์ ์์ต๋๋ค
CPU ๋ฒ์ (ONNX ์ต์ ํ ์ถ๋ก )โ
docker run์ ์ฌ์ฉ:
docker run -p 8880:8880 ghcr.io/remsky/kokoro-fastapi-cpu
docker compose๋ฅผ ์ฌ์ฉ:
name: kokoro
services:
kokoro-fastapi-cpu:
ports:
- 8880:8880
image: ghcr.io/remsky/kokoro-fastapi-cpu
restart: always