0:00 0:00
Article
Google、オープンモデルGemma 4を発表 — 推論性能でオープンモデル世界3位
Googleが新しいオープンモデルGemma 4を発表しました。31Bモデルはオープンモデルの中で世界3位にランクインし、エージェント向けワークフローにも対応しています。
パラメータあたりの性能で最高水準
Googleは2026年4月2日、新しいオープンモデルファミリーGemma 4を発表しました。「パラメータあたりで最も高性能なオープンモデル」を掲げており、高度な推論やエージェント向けワークフローに特化して設計されています。
31Bモデルは業界標準のArena AIテキストリーダーボードでオープンモデル世界3位にランクインし、26Bモデルも6位を獲得しています。自身の20倍のパラメータを持つモデルを上回る性能を発揮するとGoogleは説明しています。
4つのモデルバリエーション
Gemma 4は用途に応じて4つのサイズが用意されています。
- E2B(Effective 2B) — モバイルやエッジデバイス向けの軽量モデル
- E4B(Effective 4B) — 同じくエッジ向けだが、より高い性能を発揮
- 26B(MoE) — Mixture-of-Expertsアーキテクチャを採用し、デスクトップやサーバー環境に適合
- 31B(Dense) — 高負荷なサーバータスク向けの密結合モデル
エッジモデル(E2B/E4B)のコンテキストウィンドウは128,000トークン、大型モデル(26B/31B)は256,000トークンに対応しています。
ベンチマーク性能
31Bモデルの主要ベンチマーク結果は以下の通りです。
- 数学(AIME 2026): 89.2%
- 科学知識(GPQA Diamond): 84.3%
- 競技プログラミング(LiveCodeBench v6): 80.0%
ただし、AlibabaのQwen 3.5、Zhipu AIのGLM-5、Moonshot AIのKimi K2.5といった中国勢にはわずかに及ばないという分析もあります。一方で、OpenAIのオープンモデルに対しては大幅に上回る性能を示しています。
エージェント対応とマルチモーダル機能
Gemma 4の大きな特徴は、エージェント向けワークフローへのネイティブ対応です。関数呼び出し、構造化JSONの出力、システムインストラクションへの対応が組み込まれており、自律的なエージェントの構築を直接サポートしています。
マルチモーダル対応も充実しており、全バリエーションが画像と動画を処理できます。さらにE2BとE4Bは音声にも対応しているため、エッジデバイス上での統合的な入力処理が可能です。140以上の言語に対応している点も、グローバルな展開を見据えた設計と言えます。
入手方法とライセンス
モデルはHugging Face、Kaggle、Ollamaから即座に入手可能です。対応フレームワークはTransformers、vLLM、llama.cpp、MLX、LM Studioなど。クラウド環境ではVertex AIとGoogle Kubernetes Engineからのデプロイに対応しています。
ライセンスはApache 2.0で、商用利用も許可されています。パラメータ効率の高いオープンモデルを求める開発者にとって、有力な選択肢になりそうです。
Gemma 4: Byte for byte, the most capable open models
Gemma 4: our most intelligent open models to date, purpose-built for advanced reasoning and agentic workflows.
Gemma 4: Google's New Open Source LLMs
Google DeepMind has introduced a new generation of open AI models with Gemma 4. The model family targets developers, researchers, and companies that want