llamaをローカルPCで使ってみた
公開 2023/09/12 12:04
最終更新 2023/09/12 15:28
Open Interpreterというものを使ってみたいと考え、使い方を紹介してくれているサイトを参考にインストールを試していたのだけれども、ChatGPT-4を利用するのは嫌(というか、お金が惜しい)なので、Metaから提供されているLlamaを使う方法を採用。

結果、どうやってもうまくいかないなぁ、と。

とりあえず、Llamaというものを使ってみようということで、llama.cppをダウンロード、あ、これはコンパイルしなきゃダメか。ということで、makeしてみました。

参考にしているサイト通り実行してみるも、モデルを読み込めない。(モデルはHugging Faceからダウンロードしてきたもの。"llama-2-7b-chat.ggmlv3.q4_K_M.bin")
一度も使ったことがないと何が悪くてダメなのかわからないのがつらいですね。
結局のところ、今のllama.cppはggml形式のモデルは使えなくて、gguf形式に変換する必要があるとのこと。変換ツールもllama.cppについていますし、Hugging Faceにgguf形式のモデルも掲載されています。
lliama.cppでは8月以降、仕様変更が実施されたようで、参考にした7月半ばの記事ではカバーされていなかったというお話。この業界、わずかなタイミングの差で状況が変わりますから、面倒ですね。
(本業だったら、髪をかきむしるようなお話。いや、私程度だったらLlamaがどうのとかいう仕事はまわってこないか。業界から足を洗って15年もたっているので、仮定のネタにもなりません。)

さて、原因は分かったところでいくつかサンプルを試してみるに最初の一回目がとても遅いのと、二回目以降も遅いのが気になりました。
一回目の遅い理由は、モデルを読み込むのに時間がかかっているんだなとは思います。モデル(ggufファイル)だけでも5GBとかありますからねぇ。HDDにおいてあるので、やむなしかなと。
で、二回目以降というのは一回目ほど遅くはないんですが、どうもGPUを使っていないような気が。

深く考えずmakeするとGPUを使わないかたちになるんですね。

落ち着いてcuBLASを利用するようにmake仕直したら、GPUを使うようになりましたが劇的に変わったという感じにはなりませんでした。数割増しくらい?こんなもんなんでしょうかね。
CPU負荷は気持ち軽くなったかも。

さて、llamaについて少しは理解したところで、Open Interpreterを...やっぱりよくわかりません。
でも、便利そうなんですよねぇ。もうちょっと頑張ってみるか。
最近の記事
ZorinOSを入れてみた
Chrome OS Flexを旧型PCに入れていたんだけど、どうもデスクトップがすっきりし過ぎて落ち着かない。 いや、汚いのが良いとは…
2025/12/19 14:24
マイクロソフトは劣化が著しい
新しいパソコンが届いたのでセットアップしようとして、サーバ上の共有フォルダを開こうとしたら、「拡張エラー」??? エ…
2025/12/16 11:29
意外と使えそうなOnlyOffice
(申し訳ない、支離滅裂な駄文です。) Windows環境で事務作業をするならExcelは必須と思う。 企業で使うなら、MS Officeプ…
2025/12/09 09:13
Antigravity便利
できることが多いと使いこなすまでの苦労が多いのが困る。 というのは冗談。 機能が多くてもわからなければ使わなくていいし…
2025/12/03 09:00
Google Antigravityを入れた
Google Antigravityを使ってみた。Gemini Code AssistのAgent modeがオンになっているVSCodeとどう違うのかよくわからん。Gemin…
2025/11/24 17:38
ある意味安直な高速化、だけど人力では経験が必要な、だからLLM
作業量が大きくて時間のかかる集計処理。 pythonでやっているんだが、これはGoとかで書き直さなきゃいけないかなぁ... と…
2025/11/18 15:19
Github Copilot無料枠は月間縛りつらいが、Geminiがある
Github CopilotでGPT-5miniとかよりも、Claude Haiku 4.5がありがたいというネタもチャットクオータの壁には勝てない。(ただし…
2025/11/18 13:21
コードの変更はClaude系が強い
Gemini Code Assistは便利ということで愛用してきたわけだが、処理内容を変更せずにリファクタリングさせようとするとGithub Co…
2025/11/11 16:36
Gemini Code AssistのAgentモードが途中で停止すると...
Gemini Code Assistにリファクタリングをさせていたところ、原因不明で停止してしまった。 今日、実施していた感じでは、いく…
2025/10/24 16:27
ワイヤレスマウスの不調
会社で使用しているワイヤレスマウスが動きが悪いということで、動作確認をしてみた。 センサで使用している赤色LEDの様子を見…
2025/10/20 11:38
WiFiルーターを変更
安いのでTP-linkの‎Archer AX3000を導入した。 インターネットプロバイダーからレンタルでつかっていたんだけれども、思うとこ…
2025/10/14 11:09
恣意的という言葉は嫌い
「恣意的」その時々の思いつきで物事を判断するさま。 というのが、まず出てくるんだけれども、weblio辞書によれば、「意図…
2025/10/10 10:19
AIのせいで新人の仕事がなくなって、就職難とのお話
ここのところ、ネット記事で読むことが多いので思ったこと。 生成AIとかLLMとか、ChatGPTに代表されるようなAIが賢くなって…
2025/10/01 15:54
Github CopilotでOllamaを利用するように設定してみたが
Github CopilotでOllama(+ローカルLLM)が使えると知って、試してみた。 なんかアダプタ的な?アプリが必要そうだってどっかの…
2025/09/30 13:24
VSCodeの拡張機能:Gemini Code Assistのほうが良いと言ったが...
CopilotでGPT4.1がデフォルトで指定されていたのを、Claude Sonnet 3.5に変更したところ、こちらのほうがよりよかったという話…
2025/09/17 13:33
細かい話ではあるんだが...
どこぞの企業の執行役員が登壇で、その肩書がCDTO(Cheif Digital Technology Officer) CTO(Cheif Technology Officer)でいいじ…
2025/09/17 11:22
落ち着いて考えてみたら、Open-interpreterってもういらないな
ずっと期待して待っていた部分はあるんだけど、よく考えてみたら、Open-Interpreterでやりたいことって、Github CopilotやGemin…
2025/09/16 11:18
こりゃ、AIなしには仕事にならないわ...
ここ数日、まとまった時間が取れたので、月次処理に使っているプログラムをGemini Code Assistにリファクタリングさせている。 …
2025/09/12 16:54
米が高い
うちの親が、いつものルートで米を買おうとしたが断られたので、そこから紹介されたところから買うことになった。ネットから予…
2025/09/10 17:47
ここ数日Copilotにリファクタリングを手伝わせていたんだけれども
試行錯誤が必要だったからと、jupyter notebook上で処理をさせてきたプログラムがある。 毎月使うプログラムなので、ここらでp…
2025/09/10 16:53
もっと見る
タグ
AI(37)
IT(17)
IoT(6)
雑感(6)
愚痴(5)
AI,(4)
IT,(4)
日記(3)
RPA(2)
アニメ(2)
ChatGPTで遊ぶ(1)
Windows11(1)
自動処理(1)
もっと見る