LM StudioのMulti ModelってChatALLのローカルLLM版だねぇ。
公開 2024/03/27 09:33
最終更新 2024/03/27 09:42
いわゆるポップヒントでPlaygroundってあるから、意味不明な機能だなぁと思っていたら、バージョン0.2.17のトップ画面にMulti Modelって書いてあった。
Playgroundっていう表示が間違っているんだろうけれども。

Multi Modelっていうことなら、なんとなくわかる。
要は複数のモデルをロードしておいて、同じプロンプトに対して回答させるもの。
ChatALLのローカルLLM版ってわけですな。
ChatALLはネット上で提供されているサービスに直接アクセルするから、ローカルPCの性能に左右されないのがメリットだが、ローカルで使用できる軽量LLMに適用できないからなぁ。

Send Prompt to models ont-by-oneというチェックがプロンプト入力ボックスの下にあって、各モデルに順次プロンプトを送信して回答を待つようにするか、同時に送信して同時に回答を得るかも選べる。

軽量モデルなら、GPUのVRAMに余裕があれば2~3個ロードできるし、メモリのバランスをいじれば、ちょっと重めのモデルでも同時に使用することはできる。(この場合、メインメモリを圧迫するわけだが。)
例えば、RakutenAI-7bとGemma-7bを同時にロードしたらVRAM Usageは10GBくらい。
(ほかのモデルをロードするなら、どっちかをEjectしてくれとでた。)
RakutenAI+Gemma-2B+Elyza-7Bは同時に使えた。

同時にどんな回答が得られるかを見るだけで、大した用途はないんだけれども。
ローカルで使用するLLMって、Context Windowの問題か、連続して質問をしていくと狂ったように変な回答を連発してくるから、安定しているとは言えないんだけれども、設定なのか使い方なのか、コツってあるのかね?

あと、この画面でLocal Serverという機能があるんだけれども、Multi ModelでAPI処理が動くのかな。
あとで試したい。

----
今日はOpen Interpreterは更新されていません。最新は0.2.4です。
--localでllamafileがエラーとなり利用できません。Ollama, LM Studioは使えます。
(Janも使えると思いますが、LM Studioの出来が良いので、興味ありません。Ollamaは手軽なので時々使います。)

0.2.2ではllamafile(Phi-2)のみの対応でしたが、そこそこ動いていましたので、デグレってやつですかねぇ。Phi-2以外に対応させる流れで問題が起こっているように思いますけれども。
最近の記事
Pa.HUB経由でAmbient Light Unitを3つ接続
今度はPa.HUB経由でAmbient Light Unitを3つ接続してみる。 m5stack/M5AtomS3@^1.0.1 m5stack/M5Unified@^0.2.0 fastl…
2024/11/18 17:39
まずはAmbient Light Unit。
AtomS3 Liteから、Ambient Light Unit(1個)にアクセスできたので備忘録。 引き続きVSCODE+PlatformIOで。 今回使用したラ…
2024/11/18 14:19
会社でIoTっぽい仕事を任された
ここのところ、Pythonを使って会社のデータ集計をやってきたのですけれども、マイコンを利用したIoTっぽいことをやることになり…
2024/11/15 16:18
Ollama バージョン情報:0.4.0
0.3系から0.4にあがりました。何が変わったんでしょうね? Discordあたりに参加していればわかるのかな。 githubに上がって…
2024/11/07 08:41
Open-interpreterバージョン情報:Open Interpreter 0.4.3 Developer Preview
おや? バージョンの表記が変わった。何かが変化する予兆?
2024/10/28 09:32
LM studio 0.3.5: ダークモードに設定が固定できない?
設定回りがデグッた模様。 歳のせいか、白地に黒文字が目にきついと思うこの頃。 今は、設定可能なアプリはダークモード、色…
2024/10/28 08:18
LM Studioの代わりにJanを試した
Hugging Faceから自力で検索する分、LM studioよりも不便ではあるけれど、ggufが直接利用でき、Quadro M4000でも動くので当面、…
2024/10/25 16:12
Open Interpreter バージョン情報:Open Interpreter 0.4.2 The Beginning (Ty and Victor)
おや?バージョンが大幅に変わりましたね。 今回のアップデートではanthropicパッケージが追加されたようです。 ということは…
2024/10/25 08:43
結構ショック。Intel Arc A310
事情があって、会社で使用しているスリム型デスクトップパソコンにグラフィックボードを後付けした。 ハードウェア的な制約か…
2024/10/23 14:58
LM Studioバージョン情報:0.3.5になりました
今回のバージョンによって、GUIなしで起動できるようになりました。 これによって、今までのように 1.LM studioを起動し…
2024/10/23 09:33
衆議院選挙にかかる費用って約600億円だそうな。
何が言いたいのかというと、政治資金の収支を記載していない件、いわゆる裏金問題をマスコミはうるさく追及するけれども、奴ら…
2024/10/22 17:04
LM StudioってQuadro M4000でうまく使えない?
ちょっと前から使っているDELL Precision Tower5810 (中古) これに載っているのがQuadro M4000(VRAM8GB)なんだけど、これがCUD…
2024/10/17 09:53
Open-interpreter バージョン情報:Open Interpreter 0.3.14 The Beginning (Ty and Victor)
何が変わったんでしょう?わかりません。
2024/10/16 08:28
デスクトップ向けのLunarLakeは出ないのかねぇ?
Intelの新CPU、Core Ultra 200S(コードネームArrow Lake-S)のネタが出てきたけれども、これってNPUが1世代前みたいですねぇ。(M…
2024/10/11 10:18
JuliaとかGoとか
今、Pythonでつくった処理が遅いので、JuliaやGoで書き換えられないか思案しているところだったのだけれども、自分の知識はJuli…
2024/10/09 16:12
グラボを買ってみて思う。あと専門学校のオープンキャンパスも。
グラボ、グラフィックボードの話。あとゲーミングPCについても。 自分が買ったものはシンプルで全く問題ないんだが。 いま…
2024/10/09 08:29
Geforce RTX2060 super入手
今まで4GB Pascal世代のカード(中古PCに搭載されていたQuadro P1000)を使用していたのですが、RTX2060 superを中古で入手でき…
2024/10/07 08:16
Geforce RTX2060 Super中古
楽天のポイントがそこそこたまったのと、先月電源を交換したのでそろそろということで。 Geforce RTX3060(12GB)が欲しいとは思…
2024/10/04 09:04
LM Studio バーバージョン情報:0.3.2→0.3.3
LM Studioがバージョンアップされました。 よりシンプルな画面構成となりましたが、モデルを使用する際のプリセットの管理関係…
2024/10/02 08:37
Open Interpreter バージョン情報:Open Interpreter 0.3.13 The Beginning (Ty and Victor)
同時にアップデート、または追加インストールされたものはないようですので、割とマイナーな更新だったのかも。 ちなみに現…
2024/09/17 08:37
もっと見る
タグ
AI(21)
IT(9)
愚痴(5)
IoT(3)
日記(3)
RPA(2)
アニメ(2)
ChatGPTで遊ぶ(1)
Windows11(1)
自動処理(1)
雑感(1)
もっと見る