Article

Google、オープンモデルGemma 4を発表 — 推論性能でオープンモデル世界3位

Googleが新しいオープンモデルGemma 4を発表しました。31Bモデルはオープンモデルの中で世界3位にランクインし、エージェント向けワークフローにも対応しています。

This article is not published in this language yet, so the Japanese version is shown instead.

パラメータあたりの性能で最高水準

Googleは2026年4月2日、新しいオープンモデルファミリーGemma 4を発表しました。「パラメータあたりで最も高性能なオープンモデル」を掲げており、高度な推論やエージェント向けワークフローに特化して設計されています。

31Bモデルは業界標準のArena AIテキストリーダーボードでオープンモデル世界3位にランクインし、26Bモデルも6位を獲得しています。自身の20倍のパラメータを持つモデルを上回る性能を発揮するとGoogleは説明しています。

4つのモデルバリエーション

Gemma 4は用途に応じて4つのサイズが用意されています。

E2B（Effective 2B） — モバイルやエッジデバイス向けの軽量モデル
E4B（Effective 4B） — 同じくエッジ向けだが、より高い性能を発揮
26B（MoE） — Mixture-of-Expertsアーキテクチャを採用し、デスクトップやサーバー環境に適合
31B（Dense） — 高負荷なサーバータスク向けの密結合モデル

エッジモデル（E2B/E4B）のコンテキストウィンドウは128,000トークン、大型モデル（26B/31B）は256,000トークンに対応しています。

ベンチマーク性能

31Bモデルの主要ベンチマーク結果は以下の通りです。

数学（AIME 2026）: 89.2%
科学知識（GPQA Diamond）: 84.3%
競技プログラミング（LiveCodeBench v6）: 80.0%

ただし、AlibabaのQwen 3.5、Zhipu AIのGLM-5、Moonshot AIのKimi K2.5といった中国勢にはわずかに及ばないという分析もあります。一方で、OpenAIのオープンモデルに対しては大幅に上回る性能を示しています。

エージェント対応とマルチモーダル機能

Gemma 4の大きな特徴は、エージェント向けワークフローへのネイティブ対応です。関数呼び出し、構造化JSONの出力、システムインストラクションへの対応が組み込まれており、自律的なエージェントの構築を直接サポートしています。

マルチモーダル対応も充実しており、全バリエーションが画像と動画を処理できます。さらにE2BとE4Bは音声にも対応しているため、エッジデバイス上での統合的な入力処理が可能です。140以上の言語に対応している点も、グローバルな展開を見据えた設計と言えます。

入手方法とライセンス

モデルはHugging Face、Kaggle、Ollamaから即座に入手可能です。対応フレームワークはTransformers、vLLM、llama.cpp、MLX、LM Studioなど。クラウド環境ではVertex AIとGoogle Kubernetes Engineからのデプロイに対応しています。

ライセンスはApache 2.0で、商用利用も許可されています。パラメータ効率の高いオープンモデルを求める開発者にとって、有力な選択肢になりそうです。