たった“30億”の小さなAIが、何十倍も大きい旗艦AIに「理詰めの問題」で肩を並べた——軽自動車が、決まったコースでスーパーカーに追いついた、みたいな番狂わせ

「たった30億パラメータの“小さなAI”が、何十倍も大きい最新の巨大AIに、ある勝負で肩を並べた」——そんな論文がHacker Newsで話題になっている。モデルの名は「VibeThinker-3B（ヴァイブシンカー）」。AIの“大きさ”は「パラメータ」という部品の数で測られ、最近の最前線モデルは数千億〜という桁。対してこれは3B＝30億と、けた違いに小さい“密(dense)”モデルだ。にもかかわらず、論文は数学やプログラミングのような“答え合わせができる理詰めの問題(reasoning)”で、DeepSeek V3.2・GLM-5・Gemini 3 Proといった「桁違いに大きい旗艦モデル」に匹敵、ないし上回る、と主張する。具体的には、難関の数学コンテストAIME26で94.3点（試行を増やす“テスト時スケーリング”で97.1点）、コードの試験LiveCodeBench v6で80.2、はじめて見るLeetCodeの問題でも96.1%正解、指示の従いやすさ(IFEval)で93.4。ではどうやって小さいのに賢くしたのか——「Spectrum-to-Signal（広げてから絞る）」という鍛え方で、最初に手本でいろんな解き方を“広く”仕込み(カリキュラム学習)→強化学習で“良い手”を伸ばし→自分の良い答えで学び直す(自己蒸留)、の合わせ技だという。ただし大事な但し書きがあって、これは“なんでも屋”ではない。得意は答えが機械で確かめられる種類の問題で、雑談や常識まるごとは別。作った人たち自身、論文で「大きいAIの“置きかえ”ではなく、“補い合う相手”」と位置づけ、「小さくても、絞れば頂点に届く」という仮説(Parametric Compression-Coverage)を唱えている。ひかり・ことね・みずき・ひなたの4人が掘る。

ひかり：ねえ聞いて、これ気になる！ちっちゃい軽自動車が、ある決まったコースで、何十台ぶんも大きいスーパーカーに追いついちゃった——みたいな“番狂わせ”が、AIの世界で起きたんだって！ “30億”しかない小さなAIが、何十倍も大きい最新AIに、ある勝負で肩を並べたのっ！

ことね：それね、「VibeThinker-3B（ヴァイブシンカー）」っていうAI。まず前提を整理すると、AIの“大きさ”は「パラメータ」っていう部品の数で測るの。最近の最前線のAIは、数千億って桁。対してこれは3B——30億。けた違いに小さいのよ。なのに論文では、DeepSeek V3.2やGLM-5、Gemini 3 Proみたいな“けた違いに大きい旗艦モデル”に、ある分野で肩を並べた、って言ってるの。難しい数学コンテスト(AIME26)で94.3点、っていう高さでね。

ひかり：えーっ、じゃあもう、その小さいのだけでよくない！？ことね先輩、なんでみんな、今まで電気代もかかる“おっきいAI”を、わざわざ作ってたの？

みずき：…話がうますぎる。で？その“チビなのに天才”、なんでも出来るわけ。わたしの宿題サボる言い訳も、気のきいたウソも、考えてくれんの。

ことね：そこが大事なとこ、みずき。万能じゃないの。得意なのは、数学やプログラミングみたいに“答えがハッキリ決まってて、合ってるか機械で確かめられる”種類の問題。雑談とか、世の中まるごとの常識とかは、また別の話。作った人たち自身、論文で「これは大きいAIの“置きかえ”じゃなくて、“補い合う相手”」って、ちゃんと書いてるのよ。

みずき：…なるほどね。電卓が、スパコンより足し算は速い、みたいなもんか。用途を“理詰めの一本”に絞れば、小さいほうが鋭い、と。…“全部入りじゃない”って、最初に言え。

ことね：で、どうやって小さいのに賢くしたか、なんだけど——「Spectrum-to-Signal」、“広げてから絞る”って手順なの。最初にいろんな解き方を手本で“広く”教えて(カリキュラム学習)、次に強化学習で“良い手”だけをぐーんと伸ばして、最後は自分の出した良い答えで、自分をもう一回鍛え直す(自己蒸留)。散らかしてから、いいとこ取り。これがハマった、ってわけ。

ひなた：ふぁ〜……30億で、ちっちゃくて、おりこうさん……。なんだか、うちのおべんとうばこ、みたいなのです。……あのね。おべんとうばこって、おにぎりはきれいに入るけど、おそばは入らないのです。とくいなものだけ、ぎゅっと、いっぱい詰まってるから、ちっちゃくても、すごいのです。

みずき：…お弁当箱のたとえが、いちばん正確で、ちょっと腹立つ。…まあ、小さくて賢いのは、いいことだ。

まとめ：「たった30億パラメータの小さなAI『VibeThinker-3B』が、何十倍も大きい旗艦モデル(DeepSeek V3.2/GLM-5/Gemini 3 Pro)に、“理詰めの問題”で肩を並べた」という論文が話題。難関数学コンテストAIME26で94.3点、コードの試験でも高得点を出す。カギは「Spectrum-to-Signal（広げてから絞る）」——手本で広く仕込み、強化学習で良い手を伸ばし、自分の良答で学び直す合わせ技。ただし万能ではなく、得意は“答えを機械で確かめられる”数学・コードの類で、作り手自身「大きいAIの置きかえではなく、補い合う相手」と位置づける。みずき曰く、電卓がスパコンより足し算は速い、と同じ——用途を絞れば小さいほうが鋭い。ひなた曰く、お弁当箱は、とくいなものだけぎゅっと詰まってるから、ちっちゃくてもすごいのです。

元記事を読む／ホームへ