MF Tech
IBM Research、エージェント全体を比較する「Open Agent Leaderboard」をHugging Faceで公開
IBM Researchは2026年5月18日、AIエージェントを「モデルだけでなくシステム全体」として品質とコストで比較する「Open Agent Leaderboard」をHugging Face上で公開しました。SWE-Bench VerifiedやBrowseComp+など6種のベンチマークを統一プロトコルで実行する評価フレームワーク「Exgentic」も同時にオープン化されています。
NVIDIA、Dell Technologies Worldで「Dell AI Factory」最新版を披露。Vera Rubin NVL72ベースのPowerEdgeを発表
NVIDIA CEOのジェンスン・フアン氏は2026年5月18日、Dell Technologies WorldでマイケルDell氏とともに「Dell AI Factory with NVIDIA」の刷新を発表しました。NVIDIA Vera Rubin NVL72を搭載した「Dell PowerEdge XE9812」は、Blackwell比でトークンあたり最大10分の1のコストを主張し、Vera CPUを採用したPowerEdge M9822/R9822も投入されます。
Google、エージェント特化の「Gemini 3.5 Flash」を発表。Antigravityでサブエージェント並列実行へ
Googleは2026年5月19日のI/O 2026で、エージェントとコーディング向けに最適化した新モデル「Gemini 3.5 Flash」を発表しました。Terminal-Bench 2.1で76.2%、出力速度は他社フロンティアモデルの4倍を主張し、Antigravity経由でサブエージェントを並列実行する用途を前提に設計されています。Gemini 3.5 Proは翌月公開予定です。
Claude Codeでメモリリークやパフォーマンス問題を調査する流れ
Claude Code本体が重くなったとき、または開発中のアプリのメモリリーク・パフォーマンス問題を調査するときに踏むべき手順を整理します。`/heapdump`や`/doctor`を起点とした切り分け、測定→仮説→変更→再計測の型、AIに依頼するときの安全な渡し方までを公式仕様と現場運用の両面でまとめた、環境依存の大きい問題を切り分けたい人向けの実務ガイドです。
AIエージェントを増やしすぎたときの整理方法
Claude Codeのカスタムサブエージェントを増やしすぎて、どれを使えばよいか分からない・コストが膨らむ・誰も保守していない状態を整理する手順をまとめます。役割の棚卸し、統合と廃止、`/agents`での確認、運用ルールの再設計までを公式仕様に沿って解説する、エージェント運用が混乱したチーム向けの実務ガイドです。
AIエージェント同士の情報共有で失敗しないための設計
Claude Codeのサブエージェントや複数AIエージェントが情報をやり取りするときに起きる、コンテキストの取りこぼし・上書き・誤伝達を防ぐ設計を整理します。共有コンテキストの置き場所、引き継ぎファイルの書き方、競合と差分の扱い、レビューゲートを公式仕様と運用の両面でまとめた、複数エージェントの連携ミスを減らしたい人向けの実務ガイドです。
GitHub、Copilot CLIセッションのリモート操作を正式提供。モバイル・Web・IDEから操作可能に
GitHubは2026年5月18日、Copilot CLIセッションのリモート操作機能を正式提供(GA)に移行したと発表しました。ターミナルで始めた作業を、GitHub Mobile・github.com・VS Code・JetBrainsから監視・操作できます。GitHub外のリポジトリにも対応しました。
Anthropic、Claude Managed Agentsに自前環境でツール実行する「セルフホストサンドボックス」を追加
Anthropicは2026年5月19日、Claude Managed Agentsの新機能としてセルフホストサンドボックスとMCPトンネルを発表しました。エージェントのオーケストレーションはAnthropic側に残しつつ、ツール実行を自社インフラ側へ移せます。社内DBや非公開APIへ安全に接続する用途を想定しています。
NVIDIA、エージェント向け初の自社CPU「Vera」を主要AIラボへ出荷開始
NVIDIAは2026年5月18日、エージェント型AIのために設計した初の自社CPU「Vera」を、Anthropicなど世界有数のAIラボに出荷開始したと発表しました。88個のカスタムコア、1.2TB/sのメモリ帯域を備え、Rubin GPUと組み合わせる「Vera Rubin NVL72」構成にも対応します。
Claude Codeでパイプライン型のエージェント作業を設計する方法
調査→計画→実装→レビューを流れ作業にする、Claude Codeのパイプライン型エージェント設計を整理します。サブエージェントの直列連結・中間成果物の受け渡し・各段のレビューゲート・失敗時の戻し方まで、公式のchain subagentsに沿った実務手順です。
Claude CodeでXML風タグを使うべき場面とプロンプト例
Claude Codeの依頼文でXML風タグを使うべき場面と、使わないほうがいい場面を整理します。Anthropic公式が推奨するタグ構造の原則、コピペできるテンプレート、過剰設計を避ける判断基準まで、複雑な依頼を構造化したい人向けの実務ガイドです。
Claude Codeで大規模開発の設計相談をするときの進め方
Claude Codeを設計の壁打ち相手として使うときの進め方を、要件整理・制約の言語化・複数案の比較・リスク洗い出し・ADR記録・人間レビューの順で整理します。設計判断は人間が持つ前提で、公式のExplore→Plan→Implementとインタビュー機能に沿った実務手順です。
Claude Codeで技術的負債を増やさないリファクタリング計画
Claude Codeは速い分だけ技術的負債も速く積まれます。負債の検出・優先順位付け(影響×変更頻度)・小分けリファクタ計画・特性化テストの安全網・負債台帳の記録までを、公式のExplore→Plan→Implementに沿って実務手順として整理します。
Claude Codeでドキュメントを増やしすぎないための書き方
Claude Codeはドキュメントも量産します。CLAUDE.md・.claude/rules/・Skills・auto memory・docs/・コードコメントの役割分担と、必要な文書/不要な文書の判断基準、肥大化を防ぐ更新ルールを公式仕様ベースで整理します。
arXiv、LLM生成内容を未確認のまま投稿した著者を1年間投稿禁止に CS分野で方針
TechCrunchは2026年5月16日、論文プレプリントサーバーarXivがコンピュータサイエンス分野で、LLM生成内容を確認せず投稿した明白な証拠がある著者を1年間投稿禁止にする方針を伝えたと報じています。幻覚引用やLLMとのやり取りの混入などが対象で、低品質なAI生成投稿の急増が背景とされています。
GitHub Copilot Memory、ユーザー個人の好みを記憶する機能をPro/Pro+向けに早期アクセス提供
GitHubは2026年5月15日、Copilot Memoryがリポジトリ単位だけでなくユーザー個人の好みも記憶できるようになったと発表しました。コミットメッセージの書き方やPRの構成、コミュニケーションのトーンなどを学習し、全リポジトリやエージェントをまたいで引き継ぎます。Copilot Pro/Pro+向けの早期アクセスとして提供されます。
AIに任せすぎないためのClaude Code運用ルール
Claude Codeに任せきりにすると品質が落ちる理由を、人間が必ず見るべき5つの判断ポイント(設計・レビュー・セキュリティ・UX・責任)と、止めどころを作る運用ルール・チェックリストとして整理します。
Anthropic、法務業界向けClaude導入ガイドを公開 契約レビューやM&Aデューデリを4製品でカバー
Anthropicは2026年5月15日、法務業界へのClaude導入を体系化したガイドを公開しました。Chat・Claude Cowork・Claude for Microsoft 365・Claude Platformの4製品に加え、12の実務分野向けプラグインや3段階の導入ロードマップを提示。法務チームの生成AI利用率が前年44%から87%へ急増した調査も引用しています。
Claude Codeでよくある失敗パターンと回避策
Claude Codeを使い始めると必ずハマる10種の失敗パターンを、原因・回避策・関連記事リンクとともに整理します。曖昧な依頼・テスト不足・依存追加の暴走・コンテキスト不足・AI過信などを具体例ベースで扱います。
IBM、200言語対応の埋め込みモデル「Granite Embedding R2」をApache 2.0で公開——97MモデルでもMTEB Multilingual Retrieval 60.3点
IBMは2026年5月14日、Hugging Face上でオープン埋め込みモデル「Granite Embedding Multilingual R2」を公開しました。97Mと311Mの2サイズで200言語以上に対応し、コンテキスト長は32,768トークン。Apache 2.0ライセンスで商用利用可能で、97MモデルでもMTEB Multilingual Retrievalスコア60.3点と、3倍規模の従来モデルを上回る性能を示しています。
大きなコードベースをClaude Codeに理解させる手順
数万〜数十万行の既存リポジトリをClaude Codeに読ませて、設計判断や改修方針の相談に使えるレベルまで持っていく手順を整理します。入口ファイル特定、依存関係マップ、用語集、調査依頼テンプレ、読み込みすぎ防止までを実務目線で扱います。
GitHub、Issues画面のナビゲーションを「瞬時表示」に刷新——P10で約600ms→70msの大幅短縮
GitHubは2026年5月14日、Issues画面のナビゲーション性能を全面的に刷新した詳細を公式エンジニアリングブログで公開しました。Service WorkerによるHTMLシェル化、IndexedDBへの永続キャッシュ、プリヒート戦略の組み合わせで、ReactソフトナビゲーションのインスタントヒットはCache rollout時点で4%から22%へ、プリヒート導入後は約70%まで上昇したと案内しています。
Claude Codeで長い会話や大きなリポジトリを扱うコンテキスト管理術
数十万行規模のリポジトリや、半日以上続く長い会話でClaude Codeの精度を保つための具体策を整理します。読ませる範囲の絞り込み、中間成果物、サブエージェント分離、セッション再開、CLAUDE.md設計までを実務目線で扱います。
NVIDIA、Nous Researchの「Hermes」エージェントフレームワークがRTX PCとDGX Sparkで自己改善型AIを実現と発表
NVIDIAは2026年5月13日、Nous Researchが開発するオープンソースのエージェントフレームワーク「Hermes」が、RTX PC・RTX PROワークステーション・DGX Spark上でローカル動作し、自己進化型スキルや分離型サブエージェントによって長時間タスクをこなせると発表しました。Hermesは公開から3か月足らずでGitHubスター14万を超え、OpenRouter経由で最も利用されているエージェントだとされます。
Claude Codeで使いたいMCPサーバー厳選候補と選び方:GitHub・Notion・Sentry・PostgreSQLを用途別に比較
Claude Codeに接続できる代表的なMCPサーバー(GitHub・Sentry・Notion・PostgreSQL・Filesystem・Memoryなど)を用途別に整理。導入難易度・無料利用・セキュリティ・代替の観点で比較し、`claude mcp add`の具体例と選定チェックリストまでをまとめました。
Claude CodeのHooksで開発ワークフローを自動化する方法
Claude CodeのHooksの仕組みとイベント種別、settings.jsonでの設定例、PreToolUseで危険コマンドをブロックする方法、PostToolUseでlintを自動実行する方法、JSON出力でClaudeへフィードバックを返す方法、安全に運用するためのチェックリストまでを公式仕様に沿って整理します。
Claude Codeのカスタムスラッシュコマンドで作業を効率化する方法
Claude Codeのカスタムスラッシュコマンド(Skills)の作り方を実例ベースで整理します。`.claude/commands/`と`.claude/skills/`の関係、frontmatter、引数渡し、bash・@ファイル参照、自動起動制御、配布スコープ、よくある設計ミスまでを扱います。
AI生成コードをチームで扱うための品質ルールとレビュー基準
Claude Codeなどで生成したコードをチーム共有のコードベースに取り込むときに、品質を担保するためのルール体系を整理します。責任者・テスト・セキュリティ・依存追加・ドキュメントの5観点と、コピペで使えるレビュー基準テンプレートまで扱います。
CLAUDE.mdをチームのナレッジベースとして育てる方法
CLAUDE.mdを単なるAI向け設定ファイルから、チームの意思決定・失敗事例・暗黙ルールを残すナレッジベースへ育てる運用法を整理します。更新ルール・分割設計・検索性・肥大化対策・AGENTS.mdとの併用までを具体例つきで扱います。
GoogleとSpaceX、AI向け「軌道上データセンター」で初期協議——TechCrunchがWSJ報道として伝える
GoogleとSpaceXがAI計算リソースを地球周回軌道上に配置する「軌道上データセンター」をめぐって初期協議を行っていると、Wall Street Journalの報道を引用する形でTechCrunchが2026年5月12日に伝えました。Google「Project Suncatcher」のプロトタイプ衛星打ち上げは2027年を目標としています。