MF Blogs 便利ツール
胸にスマートフォンを装着して走るランナーの様子

記事

Google DeepMind、低視力ランナーを支援する「Running Guideエージェント」を公開。Gemma 4とオンデバイス処理を組み合わせ

Google DeepMindは2026年5月20日、低視力のランナーをリアルタイムの環境理解で支援するアクセシビリティエージェント「Running Guideエージェント」を公開しました。胸に装着したPixel 10 Proのカメラで前方を捉え、オンデバイスのセグメンテーションとGemma 4の推論を組み合わせた二経路のハイブリッド構成で、音声フィードバックによってランナーを誘導します。

0:00 0:00

Google DeepMindは2026年5月20日付のGoogle公式ブログで、低視力のランナーを支援するアクセシビリティエージェント「Running Guideエージェント」を公開しました。リアルタイムの環境理解を使い、単純な経路追従から高度な空間推論へと踏み出した取り組みだとしています。

胸にスマートフォンを装着して走るランナー

画像引用元: Google Blog

単純な経路追従からの大きな前進

Running Guideエージェントは、Google DeepMindの従来の取り組み「Project Guideline」を基盤としています。胸に装着したPixel 10 Proで前方の経路を捉え、音声フィードバックでユーザーを誘導します。

Google DeepMindは、これを単純な経路追従からリアルタイムの空間推論への大きな飛躍だと位置づけています。最終的な目標は「すべてのランナーにとっての、介助なしの自立」だとしています。BLV(盲目・低視力)ユーザーが、走るという体験を自分で行えるようにすることを目指した取り組みです。

安全を支える二経路のハイブリッド構成

高速で動くアクティビティには高い信頼性が求められるため、Google DeepMindは二経路のハイブリッドアーキテクチャを構築したとしています。役割の異なる2つの経路を組み合わせる設計です。

  • オンデバイスのセグメンテーション: Pixel 10のカスタムシリコン上で完全にオフラインで動作し、超低遅延の安全性を保証する。即座の「STOP」警告や、方向を示すチクチクという音による操舵の合図を届ける
  • Gemma 4の高度な推論: Gemma 4 E4Bを活用し、画像とテキストの複雑なマルチモーダル入力を、すべてオンデバイスで処理して高レベルのシーン理解を行う

セルラー接続がなくても、ランナーが確実な方向感覚を保てるようにする狙いです。

「Smarter Frame Selection」で遅延を抑える

Gemma 4の推論経路では、遅延を低く保つために「Smarter Frame Selection(より賢いフレーム選択)」という手法が使われています。すべてのフレームを処理するのではなく、急な地形変化や新しい障害物のような「高エントロピー」のフレームだけを分析する方式です。

これにより、処理を絞りつつ、より速く、より関連性の高いコーチングを届けられるとしています。オンデバイスで重いマルチモーダル処理を行いながら、実用的な応答速度を確保するための工夫です。

役割を分担するマルチエージェント構成

Running Guideエージェントは、複数のエージェントが協調するマルチエージェントのフレームワークとして設計されています。Google DeepMindが挙げている各エージェントの役割は次のとおりです。

  • Plannerエージェント: Gemma 4の関数呼び出しを使い、天気やGoogleマップのデータを取得。ランナーと対話してワークアウトの目標を設定し、デジタル上のスタートラインを較正する
  • Coachエージェント: 走行中に簡潔で電報的な音声警告を届ける。フィードバックをDANGER(即座の回避が必要)、WARNING(近くのランナーや障害物)、NOTICE(この先のトラックのカーブ)という厳格な階層に振り分ける
  • Breakエージェント: 休憩の間隔を管理し、アスリートがいつでもセッションを中断・再開できるようにする

インテリジェントアイウェアとコミュニティ連携

胸に装着するPixel 10 Proは堅実な基盤ですが、Google DeepMindはRunning Guideエージェントをインテリジェントアイウェア(眼鏡型デバイス)上で試作しているとしています。眼鏡型は、より広く安定した視野を提供し、マルチモーダルモデルに送るデータを大きく最適化できるとしています。

また、実環境でのテストのため、シンガポールの障害・インクルージョンの中核機関であるSG Enableと提携しています。エンジニアリングチームをBLVランナーと直接つなぎ、当事者のニーズに本当に応えるツールを反復的に設計していくとしています。

まとめ:オンデバイスAIがアクセシビリティを支える

Running Guideエージェントは、ゼロ遅延のエッジコンピューティングと深い世界理解を組み合わせた取り組みです。安全に直結する処理は完全オフラインのオンデバイスモデルで、高度なシーン理解はGemma 4でと、役割を明確に分けた構成が特徴です。

Google DeepMindは、これを「Google AIにおけるエージェントの新章を示す好例」と表現しています。マルチエージェントの役割分担とオンデバイス処理の組み合わせが、アクセシビリティという領域でどのような実用的価値を生むのか、今後の当事者との共同開発の進展が注目されます。