gpt-ossのメモリ要件って
公開 2025/09/03 16:53
最終更新 -
OpenAIのオフラインで使えるAIモデル「gpt-oss」を試して見えたこと:(ギズモードジャパン)
https://www.msn.com/ja-jp/technology/artificial-intelligence/openai%E3%81%AE%E3%82%AA%E3%83%95%E3%83%A9%E3%82%A4%E3%83%B3%E3%81%A7%E4%BD%BF%E3%81%88%E3%82%8Bai%E3%83%A2%E3%83%87%E3%83%AB-gpt-oss-%E3%82%92%E8%A9%A6%E3%81%97%E3%81%A6%E8%A6%8B%E3%81%88%E3%81%9F%E3%81%93%E3%81%A8/ar-AA1LLtn3?ocid=BingNewsSerp

この記事を読んでいて思ったんだけど、この筆者、メモリ要件を勘違いしているなぁと。GPUを使う場合、VRAMが16GBであって、macの場合、これがどうなるのかわからんけれども、16GBまたは18GBのメインメモリ*だけ*では足りないだろうということは、ローカルLLMを使い慣れてなくてもわかるんじゃないかなぁ?
gpt-ossって12GB以上あるし。これを動かすにはOSとOllamaなりLM studioなり、それなりの実行環境がいる。
M3 macといえど、32GBくらいはないと実用的でないと思うんだが。(18GBという構成があるということは、20GBとか24GBとかの構成もあったりするのかね?それなら、24GBあれば割と動くんじゃないのかね。)

ちなみに、Xeon W-2125、メインメモリ32GB+VRAM16GB(Quadro P5000)の環境なら十分実用的なスピードで使える。(体感速度だけれども。秒間トークン数とかは記録をとってない。)
ついでに、Core i7-9700、メインメモリ48GB+VRAM6GB(GeForce RTX3050)でも不満なく実行できた。

Core i5-4460(うろおぼえ、第4世代なのは確か)、メインメモリ16GB+VRAM8GB(RTX2060 Super)は遅くて実用に耐えないと感じた。
最近の記事
永代供養...事実上の無縁仏だなぁ
昨日、叔父の火葬を行ってきた。 本日、お骨を近所の葬祭ホールとの契約で樹木葬してくるとのこと。 叔父は財産もなく、妻…
2026/02/26 11:20
ローカルLLMに18トークン/秒は遅いかと聞いてみた。
NVIDIA製Nemotron-Nano-9b-v2に聞いてみた。 Xeon W-2125/Quadro P5000(16GB)搭載機でNemotron-Nano-9b-Japanese(Q4-K-S)、LM …
2026/02/23 10:46
社内で古いノートPCをゲット
Windows11へのリプレースは順調とか言っても、Windows10からのアップグレードでそれなりに利用できていたパソコンはそのままに…
2026/02/18 09:43
antigravity: Gemini3 Flashでいいんじゃないか?
antigravityで、コーディング以外にもいろいろな仕事を任せられることがわかって、日々使っているとGemini3 ProだとLowでもHigh…
2026/02/17 13:43
自分の中で固まっていないことをやろうとすると困る
課金していても、一番低い料金だと、やはり使えるトークンが少ない。 やりたいことがAIに伝わらないとき、試行回数が増える。 …
2026/02/13 14:51
選挙結果をAIに総括させてみた。
履歴の続きを利用して、「過去の予想を踏まえて総括してください。」と問い合わせてみた。 結果、履歴内容を踏まえてきちん…
2026/02/13 09:19
おそらくこれがサブスク(Google AI Plus)の恩恵
Google AI Plusに課金して、はじめてAntigravityを使用した時。 おお、これが課金した効果かと感じた。 無課金のとき、Anti…
2026/02/11 08:44
Google AI Plusに乗り換えた
Googleのクラウドストレージサービス(Google Drive)を増量するだけの名目でGoogle One(月額290円)に加入していたのだけれども、…
2026/01/29 09:22
旧PCでLinuxは動くが...(というよりCore i3の罠?)
ZorinOS18、若干貧弱なPCでも快適に使えるので、結構重宝しているんだけれども、環境を整えて本格的に使おうとしたら挫折した話…
2026/01/27 08:43
AIに議席数予測させてみた:2026年衆院選
今回はFelo、Gemini(Gemini3 Fast)、Gemini Deep Research(Gemini3 Fast)、Perplexity。 ただし、中道改革連合の支持率が出て…
2026/01/22 16:41
これは確かに不満が出るわ。Inspiron 15 3525
なんか、使っている人が不満そうなんだけど、どう不満なのか言えないみたいな微妙なパソコン。 でも、ちょっと触ってみて、…
2026/01/20 17:52
ちょっと困っていた問題が解決した話
pythonを使ってRPA的な処理を作成しようとするとき、重宝するのがSelenium。 2025年7月頃から困ってたことが、最新リリース向…
2026/01/13 13:57
Ctrl+Wが恨めしいと思った日
社長が使わなくなったからってHHKB Professional Hybridをくれた。 (ちなみに社長はHHKB Studio(墨)を使ってる。キートップ…
2026/01/13 12:07
ZorinOSを入れてみた
Chrome OS Flexを旧型PCに入れていたんだけど、どうもデスクトップがすっきりし過ぎて落ち着かない。 いや、汚いのが良いとは…
2025/12/19 14:24
マイクロソフトは劣化が著しい
新しいパソコンが届いたのでセットアップしようとして、サーバ上の共有フォルダを開こうとしたら、「拡張エラー」??? エ…
2025/12/16 11:29
意外と使えそうなOnlyOffice
(申し訳ない、支離滅裂な駄文です。) Windows環境で事務作業をするならExcelは必須と思う。 企業で使うなら、MS Officeプ…
2025/12/09 09:13
Antigravity便利
できることが多いと使いこなすまでの苦労が多いのが困る。 というのは冗談。 機能が多くてもわからなければ使わなくていいし…
2025/12/03 09:00
Google Antigravityを入れた
Google Antigravityを使ってみた。Gemini Code AssistのAgent modeがオンになっているVSCodeとどう違うのかよくわからん。Gemin…
2025/11/24 17:38
ある意味安直な高速化、だけど人力では経験が必要な、だからLLM
作業量が大きくて時間のかかる集計処理。 pythonでやっているんだが、これはGoとかで書き直さなきゃいけないかなぁ... と…
2025/11/18 15:19
Github Copilot無料枠は月間縛りつらいが、Geminiがある
Github CopilotでGPT-5miniとかよりも、Claude Haiku 4.5がありがたいというネタもチャットクオータの壁には勝てない。(ただし…
2025/11/18 13:21
もっと見る
タグ
AI(39)
IT(20)
雑感(8)
IoT(6)
AI,(5)
IT,(5)
愚痴(5)
日記(3)
RPA(2)
アニメ(2)
ChatGPTで遊ぶ(1)
Windows11(1)
自動処理(1)
もっと見る