メインコンテンツまでスキップ

RAM使用量を削減

RAMが限られる環境でこのイメージを展開する場合、イメージをスリム化するためにいくつかの手法があります。

Raspberry Pi 4 (arm64)でバージョンv0.3.10を使用した場合、アイドル時のメモリ消費を>1GBから約200MBに削減することができました(docker container statsで観測)。

TLDR

以下の環境変数を設定してください(または既存デプロイメントの対応するUI設定を変更):RAG_EMBEDDING_ENGINE: ollama, AUDIO_STT_ENGINE: openai

詳細な説明

メモリ消費の大部分は、読み込まれているMLモデルに起因しています。外部の言語モデル(OpenAIまたは非バンドル型のollama)を使用している場合でも、多くのモデルが追加用途のために読み込まれる可能性があります。

v0.3.10では以下が含まれます:

  • 音声からテキストへの変換(デフォルトではwhisper)
  • RAG埋め込みエンジン(デフォルトではローカルSentenceTransformersモデル)
  • 画像生成エンジン(デフォルトでは無効)

最初の2つはデフォルトで有効化されており、ローカルモデルに設定されています。これらのモデルは管理パネルで変更できます(RAG:DocumentsカテゴリでOllamaまたはOpenAIに設定、音声からテキストへの変換:AudioセクションでOpenAIまたはWebAPIと連携)。 新しいDockerイメージを展開する場合、以下の環境変数で設定することも可能です:RAG_EMBEDDING_ENGINE: ollama, AUDIO_STT_ENGINE: openai。ただし、既にconfig.jsonが存在する場合にはこれらの環境変数は効果を持ちません。