MF Blogs 便利ツール
画像・音声波形・テキスト・コード記号などモダリティ別アイコンを並べたタイル状の抽象イラスト

記事

Microsoft、Build 2026で自社AI「MAI」を刷新——推論・画像・音声など5つの新モデルを発表

Microsoftは2026年6月2日、Build 2026で自社開発のAIモデル群「MAI」を一挙に拡充しました。推論モデルMAI-Thinking-1や画像生成のMAI-Image-2.5など5モデルを投入し、PowerPointやGitHub Copilot、VS Codeに順次組み込みます。

0:00 0:00

Microsoftは2026年6月2日、開発者向けカンファレンスMicrosoft Build 2026で、自社開発のAIモデル群「MAI(Microsoft AI)」を一挙に拡充したと発表しました。推論、画像、音声、文字起こし、コードという5つの領域でそれぞれ新モデルを投入し、PowerPointやGitHub Copilotなど既存の製品に順次組み込んでいくとしています。

画像・音声波形・テキスト・コードなどモダリティ別アイコンを並べたタイル状の概念図

図版: Microsoftの発表内容をもとに作成(出典: The Official Microsoft Blog

5領域で自社モデルを一挙に投入

今回の発表で軸になるのが、Microsoftが自前で開発するMAIシリーズの拡充です。推論向けのMAI-Thinking-1、画像のMAI-Image-2.5、音声のMAI-Voice-2、文字起こしのMAI Transcribe 1.5、コーディングのMAI-Code-1という5つのモデルが出そろいました。

外部モデルに依存しすぎず、自社で基盤モデルを育てる姿勢を改めて示した形です。これらのモデルは単体で動くだけでなく、Microsoftが提供する各製品の裏側に組み込まれ、利用者が普段の作業の中で自然に使える形を目指しています。

推論モデルMAI-Thinking-1の実力

5モデルの中でも注目度が高いのが、推論に特化したMAI-Thinking-1です。パラメータ数は350億で、一度に扱える文脈の長さは256Kトークンに対応します。

Microsoftによると、独立した評価者による比較では同モデルがClaude Sonnet 4.6よりも好まれ、コーディング能力を測るSWE Bench ProではClaude Opus 4.6に匹敵する成績を示したとしています。比較的コンパクトなサイズで上位モデルに迫る性能をうたっており、コストと性能のバランスを意識したモデルだといえます。あくまで同社が公表した数値であり、実際の使い勝手は用途次第で変わる点には留意が必要です。

画像・音声・コードは製品に直接組み込み

残る4モデルは、それぞれ得意分野で製品への組み込みが進みます。画像生成のMAI-Image-2.5は、Microsoftの集計で画像生成ベンチマークArenaのテキストから画像で3位、画像から画像で2位につけたとされ、すでにPowerPointで利用でき、OneDriveにも順次展開されます。

文字起こしのMAI Transcribe 1.5は43言語に対応し、ストリーミング処理も近く加わる予定です。音声のMAI-Voice-2は新たに15言語以上が追加されました。コーディング向けのMAI-Code-1はGitHub向けに最適化された推論効率重視のモデルで、CopilotとVisual Studio Codeから利用できます。日々使うツールの中にモデルが溶け込んでいく方向性がはっきりしています。

ローカル実行と安全な実行環境も強化

モデルやエージェントそのものに加えて、それらを動かす基盤の発表もありました。「Surface RTX Spark Dev Box」は、最大1200億パラメータの大規模言語モデルを手元のマシンで動かせる開発機です。クラウドに送りたくない機密データを扱う開発で、ローカル実行という選択肢が現実的になります。

あわせて、OSレベルで隔離する実行環境「Microsoft Execution Containers(MXC)」も示されました。エージェントが自律的にコードを実行する場面が増える中、何をどこまで実行させるかを安全に区切る仕組みは欠かせません。賢いモデルと、それを安全に動かす土台の両輪で開発体験を整えようとする狙いがうかがえます。

エージェントと研究基盤も前進

モデル以外の発表も充実していました。エージェントに最新の実世界情報を素早く与える「Web IQ」は、Microsoftによると次点の手段に比べておよそ2.5倍の速さで結果を返すとしています。個人の業務を支えるエージェント「Microsoft Scout」は、会議の準備や日程調整を肩代わりします。

科学研究向けのエージェントAI基盤「Microsoft Discovery」は一般提供に移行しました。研究のワークフロー全体をAzure上で支えるもので、企業の研究開発での活用が見込まれます。開発者にとっては、自社プロダクトにどのモデルとエージェント基盤を組み合わせるか、選択肢が一段と増えた発表になりました。明日からの開発で、どの機能を取り込むかを見極める段階に入ります。