์ด ํํ ๋ฆฌ์ผ์ ์ปค๋ฎค๋ํฐ ๊ธฐ์ฌ๋ก ์ ๊ณต๋๋ฉฐ Open WebUI ํ์ ์ง์์ ๋ฐ์ง ์์ต๋๋ค. ์ด๋ ํน์ ์ฌ์ฉ ์ฌ๋ก์ ๋ง๊ฒ Open WebUI๋ฅผ ์ฌ์ฉ์ ์ ์ํ๋ ๋ฐฉ๋ฒ์ ๋ณด์ฌ์ฃผ๋ ๋ฐ ๋ชฉ์ ์ด ์์ต๋๋ค. ๊ธฐ์ฌํ๊ณ ์ถ์ผ์ ๊ฐ์? ๊ธฐ์ฌ ํํ ๋ฆฌ์ผ์ ํ์ธํด๋ณด์ธ์.
์ด ๊ฐ์ด๋๋ ์๋ ์ค์น๋ฅผ ํตํ Open WebUI ์ค์ ์ด ํ์ธ๋์์ต๋๋ค.
Intel GPU์์ IPEX-LLM์ ์ฌ์ฉํ Local LLM ์ค์
IPEX-LLM์ ๋ฎ์ ์ง์ฐ ์๊ฐ์ผ๋ก Intel CPU ๋ฐ GPU(์: iGPU๊ฐ ์ฅ์ฐฉ๋ ๋ก์ปฌ PC, Arc A-Series, Flex ๋ฐ Max์ ๊ฐ์ ๋์คํฌ๋ฆฌํธ GPU)์์ LLM์ ์คํํ๊ธฐ ์ํ PyTorch ๋ผ์ด๋ธ๋ฌ๋ฆฌ์ ๋๋ค.
์ด ํํ ๋ฆฌ์ผ์ Intel GPU์์ ํธ์คํ ๋๋ IPEX-LLM ๊ฐ์ Ollama ๋ฐฑ์๋์ ํจ๊ป Open WebUI๋ฅผ ์ค์ ํ๋ ๋ฐฉ๋ฒ์ ๋ณด์ฌ์ค๋๋ค. ์ด ๊ฐ์ด๋๋ฅผ ๋ฐ๋ผํ๋ฉด ํตํฉ GPU๋ง ์๋ ์ ๊ฐํ PC์์๋ Open WebUI๋ฅผ ์ํํ ๊ฒฝํ์ผ๋ก ์ค์ ํ ์ ์์ต๋๋ค.
Intel GPU์์ Ollama Serve ์์ํ๊ธฐโ
Intel GPU์์ IPEX-LLM์ผ๋ก ๊ฐ์๋ Ollama ์๋ฒ๋ฅผ ์ค์นํ๊ณ ์คํํ๋ ๋ฐฉ๋ฒ์ IPEX-LLM ๊ณต์ ๋ฌธ์์ ์ด ๊ฐ์ด๋๋ฅผ ์ฐธ์กฐํ์ญ์์ค.
๋ค๋ฅธ ๊ธฐ๊ธฐ์์ Ollama ์๋น์ค๋ฅผ ์ด์ฉํ๋ ค๋ฉด OLLAMA_HOST=0.0.0.0
ํ๊ฒฝ ๋ณ์๋ฅผ ์ค์ ํ๊ฑฐ๋ ๋ด๋ณด๋ธ ํ ollama serve
๋ช
๋ น์ ์คํํด์ผ ํฉ๋๋ค.
Open WebUI ๊ตฌ์ฑโ
๋ฉ๋ด์์ ์ค์ -> ์ฐ๊ฒฐ์ ํตํด Ollama ์ค์ ์ ์ ๊ทผํ์ญ์์ค. ๊ธฐ๋ณธ์ ์ผ๋ก Ollama ๊ธฐ๋ณธ URL์ https://localhost:11434
๋ก ์ค์ ๋์ด ์์ผ๋ฉฐ, ์๋ ์ค๋
์ท๊ณผ ๊ฐ์ด ํ์๋ฉ๋๋ค. Ollama ์๋น์ค ์ฐ๊ฒฐ ์ํ๋ฅผ ํ์ธํ๋ ค๋ฉด, ํ
์คํธ ๋ฐ์ค ์์ ์๋ ์๋ก ๊ณ ์นจ ๋ฒํผ์ ํด๋ฆญํ์ญ์์ค. WebUI๊ฐ Ollama ์๋ฒ์ ์ฐ๊ฒฐ๋์ง ์์ผ๋ฉด WebUI could not connect to Ollama
๋ผ๋ ์ค๋ฅ ๋ฉ์์ง๊ฐ ํ์๋ฉ๋๋ค.
์ฐ๊ฒฐ์ด ์ฑ๊ณตํ๋ฉด Service Connection Verified
๋ผ๋ ๋ฉ์์ง๊ฐ ํ์๋ฉ๋๋ค. ์๋์ ์ค๋ช
๋ ๋ฐ์ ๊ฐ์ต๋๋ค.
๋ค๋ฅธ URL์์ ํธ์คํ ๋ Ollama ์๋ฒ๋ฅผ ์ฌ์ฉํ๋ ค๋ฉด Ollama ๊ธฐ๋ณธ URL์ ์ URL๋ก ์ ๋ฐ์ดํธํ๊ณ ์๋ก ๊ณ ์นจ ๋ฒํผ์ ๋๋ฌ Ollama์์ ์ฐ๊ฒฐ์ ๋ค์ ํ์ธํ์ญ์์ค.