0:00 0:00
記事
Meta、キャパシティ効率化を担うAIエージェント基盤を公開——10時間の調査を30分に圧縮、数百MW規模の電力を回収
Metaは性能最適化を自動化する統合AIエージェント基盤を発表しました。FBDetectの0.005%のリグレッションを捕捉し、攻め・守りを同じMCPツールとSkillで回す設計で、数百MWの電力を取り戻したとしています。
ハイパースケールな性能最適化をAIエージェントに任せる
Metaは2026年4月16日、エンジニアリングブログで「Capacity Efficiency Program」と名付けた統合AIエージェント基盤を公開しました。社内の性能最適化を自動化するのが目的で、リグレッション検知から改善PRの生成までを一連のワークフローとして束ねています。
発表したのはTommy Tran氏とMichael Zetune氏の両エンジニアで、数百メガワット規模の電力を回収したと報告しています。これは「数十万世帯の年間電力需要に相当する」とされ、ハイパースケーラーならではのスケールで数字が語られています。調査時間も、手作業で約10時間かかっていた性能問題の原因特定を、自動化によって約30分に短縮できるようになったとしています。

画像引用元: Meta Engineering Blog
「守り」と「攻め」を同じ基盤で回す
Capacity Efficiencyは「Defense(守り)」と「Offense(攻め)」の2面で動いています。守り側の中心となるのが、Metaが以前から使っているリグレッション検知ツール「FBDetect」です。FBDetectは0.005%という極めて小さな性能劣化まで検出する粒度を持っています。
劣化が見つかると、AI Regression Solverが自動でプルリクエストを生成し、ロールバックや場当たり的なワークアラウンドではなく「前進して直す」形で修正を差し戻します。攻め側では、最適化の余地をエージェントが能動的に掘り当て、効率改善のPR候補を生成する運用が組まれています。エンジニアはレビュアーとして要否を判断するだけでよく、時間のかかる調査と試行錯誤をエージェントが肩代わりする構図です。
MCPツールとSkillを共有する設計
基盤の中核は「MCP Tools」と「Skills」の2つに整理されています。MCP Toolsは、プロファイリングデータの取得、実験結果の参照、設定履歴の照会、ソースコード検索といった操作に標準化されたインタフェースを提供します。Anthropicが提唱するModel Context Protocolをベースにしていることが名前から示唆されます。
一方のSkillsは、シニアエンジニアの推論パターンをまとめた「どのツールをいつ使い、結果をどう解釈するか」のノウハウを明文化したものです。守りと攻めは同じMCP Toolsを共有し、Skillsだけを差し替えることで役割を切り替える設計になっています。この共通基盤化によって、ツールの改善が両側に即反映され、保守コストをかけずにスケールできる仕組みが実現しています。
数字で語るインパクト
Metaが公表している定量効果はわかりやすい形に整理されています。まず、約10時間の手作業調査がおよそ30分に圧縮されたことで、エンジニアのリードタイムが桁単位で改善しました。回収された電力は数百メガワット規模で、データセンターの物理増設を先送りできる水準です。
これらの数字は単なる人件費削減では片付けられない意味合いを持っています。グローバルに分散したデータセンターで常時稼働している推論・学習ワークロードにおいて、わずかな効率改善でも積み上がると大きな電力とコストになるという、ハイパースケーラー固有の経済性を踏まえた成果です。
共通基盤が生むエージェント応用の広がり
同じMCP ToolsとSkillsの組み合わせは、Capacity Efficiencyの枠を越えて社内の他の領域にも展開されています。Metaは具体例として、コンバセーショナルアシスタント、キャパシティプランニング用のエージェント、ガイド付きワークフローといった活用先を挙げています。
ここで重要なのは、同じ基盤を使い回すことで、チームごとにフルスタックのエージェントを作り直さずに済んでいる点です。エンジニアリング組織の拡張を人員増に頼らず、共通ツール+ドメイン特化のSkillsで担保する方針は、他のハイパースケーラーや、大規模アプリを抱える企業にとっても参考になる設計パターンと言えそうです。
Capacity Efficiency at Meta: How Unified AI Agents Optimize Performance at Hyperscale
We’re sharing insights into Meta’s Capacity Efficiency Program, where we’ve built an AI agent platform that helps automate finding and fixing performance issues throughout our inf…