Article

Google Cloud Next 2026でWorkspace IntelligenceとTPU 8t／8iが発表——超大規模Pod構成と推論コスト改善

9to5Googleが2026年4月22日に伝えたところによれば、Google Cloud Next 2026の基調講演でWorkspace Intelligenceと新世代TPU 8t／8iが発表されました。TPU Podは最大9,600チップ規模、推論価格性能で従来比80%改善とされています。

This article is not published in this language yet, so the Japanese version is shown instead.

Google Cloud Next 2026の主要発表

9to5Googleが2026年4月22日に報じたところによれば、米ラスベガスで開催中のGoogle Cloud Next 2026の基調講演で、Google Cloudはエンタープライズ向けの新ブランド「Workspace Intelligence」と、新世代TPU「TPU 8t」「TPU 8i」を中心に複数の発表を行いました。

Workspace Intelligenceは、これまでGoogle WorkspaceにGemini for Workspaceとして組み込まれていたAI機能群を、エンタープライズ向けの単一製品ラインに整理し直したもので、業務文書の生成・要約に加え、社内システムを横断するエージェント機能が標準で提供されるようになります。

TPUチップ群とアプリケーションが接続されたAIインフラ図

画像引用元: 9to5Google

TPU 8tと8iの位置づけ

ハードウェア面では、新世代TPUとして学習向けの「TPU 8t」と推論向けの「TPU 8i」が発表されました。9to5Googleの記事で紹介されているスペックの要点は次のとおりです。

TPU 8t（学習向け）：従来世代比で学習価格性能（price-performance）が約2.8倍改善。1つのスーパーポッドで最大9,600チップを相互接続し、合計で121 ExaFlops規模の演算性能を提供。
TPU 8i（推論向け）：推論価格性能が約80%改善。長文コンテキスト処理と低レイテンシ応答に最適化され、エンタープライズ向けの大規模推論サービングを想定。

両モデルともにGoogle Cloud独自のOptical Circuit Switching（OCS）と液冷スタックを引き続き採用し、既存のA3系GPUインスタンスとは別系統で、エンタープライズの推論コストを抑える選択肢として位置づけられています。同時に、Vertex AIのGemini系エンドポイントが順次TPU 8iへ移行されることで、料金とレイテンシの双方が見直される見通しです。

Workspace Intelligenceの具体機能

Workspace Intelligenceの新機能として9to5Googleが紹介しているのは、メールやチャット、ドキュメントを横断して長期コンテキストを保持する「Workspace Memory」、Sheetsで自然言語からダッシュボードを生成する「Sheets Insights」、Meet会議の発言を構造化された議事録と次アクションに整理する「Meet Briefings」、そしてGmail内で外部のサードパーティアプリと連携できる「Workspace Agents」です。

Workspace AgentsはAgent Development Kit（ADK）で社内開発する経路と、Google Cloud Marketplace経由で外部ベンダーが配布する経路の2系統が用意され、企業ごとにアクセス制御や監査ログを設定できます。AIエージェントの管理コンソールはWorkspace管理画面に統合される見込みです。

開発者がgcloud CLIから新しいTPU推論エンドポイントを試すには、以下のような手順が想定されています。

gcloud config set project YOUR_PROJECT_ID
gcloud ai endpoints predict YOUR_ENDPOINT_ID \
  --region=us-central1 \
  --json-request=request.json

リクエスト本体（request.json）の構造は従来のVertex AIと共通で、TPU 8iに最適化されたエンドポイントを指定することで、価格性能を改善した推論を呼び出せる構成です。

TPU 8tスーパーポッドの規模感

TPU 8tスーパーポッドの「9,600チップ」「121 ExaFlops」という数字は、これまでのTPU v5p世代の8,960チップ／1ポッドと比較しても密度を引き上げており、Geminiクラスのモデル学習を社内基盤として運用したい企業にとっては、調達経路の選択肢が広がる発表です。同時に、NVIDIAとの提携拡大によるRubin世代GPU供給とあわせると、Google CloudはTPUとGPUの両方を「使い分ける前提」で揃える方針が一層明確になっています。

エンジニア視点で押さえたいポイント

エンジニアリングの観点で関心が集まりそうなのは、TPU 8iの一般提供（GA）時期と料金体系、Workspace Memoryのデータ保持範囲とアクセス制御の粒度、Workspace Agentsの監査ログ仕様の3点です。9to5Googleの記事では一部の機能はプレビューや段階提供と紹介されており、本番投入前に検証期間を確保しておくのが現実的です。

Google Cloud Next 2026は会期中で、関連セッションが順次公開される予定です。詳細仕様は今後Google Cloud公式ブログで補足される見込みのため、プレスでの数値は更新される可能性があります。

9to5Google

出典 9to5Google

Google Cloud Next 2026: Workspace Intelligence and new TPU 8t/8i unveiled