R1-1776 by Perplexity-Ai 使ってみたいけれども、大きすぎて無理
公開 2025/02/21 08:39
最終更新
2025/02/21 09:07
PerplexityがDeepSeek-R1に対してポストトレーニングを施し、中国政府に忖度しないAIに仕上げたそう。
オープンソースはこれができるからいいので、DeepSeekはそれほど悪い企業とも思わない。
中国国内でサービスを行おうとすると、共産党の影響を受けざるを得ないので、おそらく補助金等のメリットも少なくないだろうが、デメリットも相応にあるということ。
(H100だろうがH800だろうがA100だろうが、数万個のオーダーを私企業がだすのは厳しかろう。DeepSeekは投資企業としてお金はあったようだが。)
で、これを使ってみたいとHugging Faceを検索してみると、量子化されたものであっても200GBとか300GBとかあって、ローカルで利用するのは無理だなぁと。
ま、これを利用してサービスしてくれるところは出てくるだろうし、ひょっとしたら同様に7~14bあたりのものも追加学習してくれるかもしれない。cyberagentあたりならやってくれるんじゃなかろうか。
(他力本願だが、RTX4070にすら手が出せない小物にはしかたあるまいて。)
ちなみにPerplexity( https://www.perplexity.ai/ )ではR1で天安門事件について中国の検閲を受けていないレベルの回答を返してくれるので、これなら十分評価に使えると思う。(少なくとも中国に偏向した知識レベルのchatボットは使いにくいから。)
オープンソースはこれができるからいいので、DeepSeekはそれほど悪い企業とも思わない。
中国国内でサービスを行おうとすると、共産党の影響を受けざるを得ないので、おそらく補助金等のメリットも少なくないだろうが、デメリットも相応にあるということ。
(H100だろうがH800だろうがA100だろうが、数万個のオーダーを私企業がだすのは厳しかろう。DeepSeekは投資企業としてお金はあったようだが。)
で、これを使ってみたいとHugging Faceを検索してみると、量子化されたものであっても200GBとか300GBとかあって、ローカルで利用するのは無理だなぁと。
ま、これを利用してサービスしてくれるところは出てくるだろうし、ひょっとしたら同様に7~14bあたりのものも追加学習してくれるかもしれない。cyberagentあたりならやってくれるんじゃなかろうか。
(他力本願だが、RTX4070にすら手が出せない小物にはしかたあるまいて。)
ちなみにPerplexity( https://www.perplexity.ai/ )ではR1で天安門事件について中国の検閲を受けていないレベルの回答を返してくれるので、これなら十分評価に使えると思う。(少なくとも中国に偏向した知識レベルのchatボットは使いにくいから。)
