gpt-ossのメモリ要件って
公開 2025/09/03 16:53
最終更新 -
OpenAIのオフラインで使えるAIモデル「gpt-oss」を試して見えたこと:(ギズモードジャパン)
https://www.msn.com/ja-jp/technology/artificial-intelligence/openai%E3%81%AE%E3%82%AA%E3%83%95%E3%83%A9%E3%82%A4%E3%83%B3%E3%81%A7%E4%BD%BF%E3%81%88%E3%82%8Bai%E3%83%A2%E3%83%87%E3%83%AB-gpt-oss-%E3%82%92%E8%A9%A6%E3%81%97%E3%81%A6%E8%A6%8B%E3%81%88%E3%81%9F%E3%81%93%E3%81%A8/ar-AA1LLtn3?ocid=BingNewsSerp

この記事を読んでいて思ったんだけど、この筆者、メモリ要件を勘違いしているなぁと。GPUを使う場合、VRAMが16GBであって、macの場合、これがどうなるのかわからんけれども、16GBまたは18GBのメインメモリ*だけ*では足りないだろうということは、ローカルLLMを使い慣れてなくてもわかるんじゃないかなぁ?
gpt-ossって12GB以上あるし。これを動かすにはOSとOllamaなりLM studioなり、それなりの実行環境がいる。
M3 macといえど、32GBくらいはないと実用的でないと思うんだが。(18GBという構成があるということは、20GBとか24GBとかの構成もあったりするのかね?それなら、24GBあれば割と動くんじゃないのかね。)

ちなみに、Xeon W-2125、メインメモリ32GB+VRAM16GB(Quadro P5000)の環境なら十分実用的なスピードで使える。(体感速度だけれども。秒間トークン数とかは記録をとってない。)
ついでに、Core i7-9700、メインメモリ48GB+VRAM6GB(GeForce RTX3050)でも不満なく実行できた。

Core i5-4460(うろおぼえ、第4世代なのは確か)、メインメモリ16GB+VRAM8GB(RTX2060 Super)は遅くて実用に耐えないと感じた。
最近の記事
意外と使えそうなOnlyOffice
(申し訳ない、支離滅裂な駄文です。) Windows環境で事務作業をするならExcelは必須と思う。 企業で使うなら、MS Officeプ…
2025/12/09 09:13
Antigravity便利
できることが多いと使いこなすまでの苦労が多いのが困る。 というのは冗談。 機能が多くてもわからなければ使わなくていいし…
2025/12/03 09:00
Google Antigravityを入れた
Google Antigravityを使ってみた。Gemini Code AssistのAgent modeがオンになっているVSCodeとどう違うのかよくわからん。Gemin…
2025/11/24 17:38
ある意味安直な高速化、だけど人力では経験が必要な、だからLLM
作業量が大きくて時間のかかる集計処理。 pythonでやっているんだが、これはGoとかで書き直さなきゃいけないかなぁ... と…
2025/11/18 15:19
Github Copilot無料枠は月間縛りつらいが、Geminiがある
Github CopilotでGPT-5miniとかよりも、Claude Haiku 4.5がありがたいというネタもチャットクオータの壁には勝てない。(ただし…
2025/11/18 13:21
コードの変更はClaude系が強い
Gemini Code Assistは便利ということで愛用してきたわけだが、処理内容を変更せずにリファクタリングさせようとするとGithub Co…
2025/11/11 16:36
Gemini Code AssistのAgentモードが途中で停止すると...
Gemini Code Assistにリファクタリングをさせていたところ、原因不明で停止してしまった。 今日、実施していた感じでは、いく…
2025/10/24 16:27
ワイヤレスマウスの不調
会社で使用しているワイヤレスマウスが動きが悪いということで、動作確認をしてみた。 センサで使用している赤色LEDの様子を見…
2025/10/20 11:38
WiFiルーターを変更
安いのでTP-linkの‎Archer AX3000を導入した。 インターネットプロバイダーからレンタルでつかっていたんだけれども、思うとこ…
2025/10/14 11:09
恣意的という言葉は嫌い
「恣意的」その時々の思いつきで物事を判断するさま。 というのが、まず出てくるんだけれども、weblio辞書によれば、「意図…
2025/10/10 10:19
AIのせいで新人の仕事がなくなって、就職難とのお話
ここのところ、ネット記事で読むことが多いので思ったこと。 生成AIとかLLMとか、ChatGPTに代表されるようなAIが賢くなって…
2025/10/01 15:54
Github CopilotでOllamaを利用するように設定してみたが
Github CopilotでOllama(+ローカルLLM)が使えると知って、試してみた。 なんかアダプタ的な?アプリが必要そうだってどっかの…
2025/09/30 13:24
VSCodeの拡張機能:Gemini Code Assistのほうが良いと言ったが...
CopilotでGPT4.1がデフォルトで指定されていたのを、Claude Sonnet 3.5に変更したところ、こちらのほうがよりよかったという話…
2025/09/17 13:33
細かい話ではあるんだが...
どこぞの企業の執行役員が登壇で、その肩書がCDTO(Cheif Digital Technology Officer) CTO(Cheif Technology Officer)でいいじ…
2025/09/17 11:22
落ち着いて考えてみたら、Open-interpreterってもういらないな
ずっと期待して待っていた部分はあるんだけど、よく考えてみたら、Open-Interpreterでやりたいことって、Github CopilotやGemin…
2025/09/16 11:18
こりゃ、AIなしには仕事にならないわ...
ここ数日、まとまった時間が取れたので、月次処理に使っているプログラムをGemini Code Assistにリファクタリングさせている。 …
2025/09/12 16:54
米が高い
うちの親が、いつものルートで米を買おうとしたが断られたので、そこから紹介されたところから買うことになった。ネットから予…
2025/09/10 17:47
ここ数日Copilotにリファクタリングを手伝わせていたんだけれども
試行錯誤が必要だったからと、jupyter notebook上で処理をさせてきたプログラムがある。 毎月使うプログラムなので、ここらでp…
2025/09/10 16:53
石破退陣で思うこと
やっと辞めることを決めたか。無能石破。 まあ、うちの爺婆はテレビの言うことを真に受けるのは仕方ないとして。 でも臨時…
2025/09/08 12:07
gpt-ossのメモリ要件って
OpenAIのオフラインで使えるAIモデル「gpt-oss」を試して見えたこと:(ギズモードジャパン) https://www.msn.com/ja-jp/tech…
2025/09/03 16:53
もっと見る
タグ
AI(37)
IT(17)
IoT(6)
雑感(6)
愚痴(5)
AI,(4)
IT,(4)
日記(3)
RPA(2)
アニメ(2)
ChatGPTで遊ぶ(1)
Windows11(1)
自動処理(1)
もっと見る