MF Blogs 便利ツール
握手を交わす2人のシルエットを写したモノクロ写真

記事

Anthropicが社内で実施した「Project Deal」:AIエージェント同士が現金で取引する実験

Anthropicは社員69人にギフトカード100ドルずつを配り、AIエージェントが代理で売買する実験「Project Deal」を実施したとTechCrunchが報じました。186件の取引で4000ドル超が動き、モデル品質の差が結果に表れた一方、利用者はその差に気付きにくいことも示されました。

0:00 0:00

Anthropic社内で「エージェント同士が現金で取引する」実験が回された

TechCrunchは2026年4月25日、Anthropicが社内で実施したAIエージェント同士の取引実験「Project Deal」を報じました。

実験では、社員69人にそれぞれ100ドルのギフトカードが渡され、買い手も売り手もAIエージェントが代理で交渉と取引を行ったと説明されています。対象は架空の商品ではなく実在のモノで、取引が成立すれば実際にお金が動く設計でした。

結果として、合計186件の取引が成立し、4000ドル超がエージェント間で動いたと記事は伝えています。Anthropicは「Project Dealがどれだけ機能したかに驚いた」とコメントしたとされ、AIエージェントが商取引の意思決定を任される将来像を、自社の社員と現金で検証した格好です。

4種類のマーケットプレイスを比較する設計

TechCrunchによると、Project Dealは1つのフォーマットで完結したのではなく、4つの異なるマーケットプレイス構成を比較する形で実施されたと報じられています。そのうちの1つは「リアル」マーケットプレイスとされ、実験後に取引が実際に履行される設定だったと説明されています。

複数構成を並べた狙いは、エージェント代理取引がどこまで実用に耐えるかを切り分けることにあります。具体的には、モデル品質の差が結果にどう影響するか、そしてその差にユーザー本人が気付けるかという2点が中心の検証ポイントだったと記事は伝えています。

エージェント代理での購買は、商品検索から条件交渉、決済までを含む長い意思決定の連鎖で構成されます。Anthropicは1つのテンプレートに揃えるのではなく、複数構成で並列に走らせることで、どこで差が出るかを観察しやすい環境を作ったとみられます。

握手を交わす2人のシルエット

画像引用元: TechCrunch

高性能モデルが「客観的に良い結果」を出した

実験の主要な発見として記事が紹介しているのは、より高性能なAIモデルを代理に立てた利用者は、客観的に見て良い取引結果を得たという点です。これは直感的にも納得しやすい結論ですが、続いて報告されている観察のほうが重要かもしれません。

Anthropicの分析として、ユーザー本人は「自分が悪い取引をした」ことに気付きにくい傾向が示されたとTechCrunchは伝えています。これは、エージェントに任せきりにするほど、「同じ商品でもより安く買えたはずだ」「同じ商品をより高く売れたはずだ」という比較が見えなくなる可能性があることを意味します。

記事はこの現象を「エージェント品質ギャップ(agent quality gaps)」と呼ぶ表現で紹介しており、モデルの選択がそのまま経済的な格差につながりうる構造を示唆しています。エージェント代理取引が広がる将来像において、利用者保護や開示のあり方が論点になることを予感させる結果です。

一方で「初期指示」の効きは限定的

もう1つの興味深い観察として、TechCrunchは初期にエージェントへ与える指示(プロンプト)の違いは、成約確率や成立価格に大きな影響を与えなかったと報告しています。

これは「いかに上手なプロンプトを書くか」よりも、「どのモデルに任せるか」のほうが結果に直結したことを示します。エージェント代理取引のような連続的な意思決定では、初手の指示よりも、その後の交渉や判断を回し続けるモデル本体の能力差が積み上がるためと解釈できます。

利用者から見れば、「強いモデルを買い手にも売り手にも立てる」ことの効きが、テンプレ的なプロンプト工夫よりも大きい可能性が示された格好です。

実取引データで議論を進めるための一歩

Project Dealの大きな特徴は、AIエージェント同士の取引を机上のシミュレーションではなく、実際の現金が動く環境で観察した点にあります。エージェント代理取引はこれまで論点として語られることが多かった一方、実データに基づく議論は限定的でした。

Anthropicが社内で69人・186件・4000ドル超という規模の実取引データを取ったことは、モデル品質と利用者保護の関係を実証ベースで議論するための土台になります。実験後の取り扱いや今後の追加検証については、記事内では具体的な計画は示されていませんが、エージェント代理取引の議論を一段先に進める材料として注目されそうです。

Claudeを中心としたエージェントの社会実装に向けて、Anthropic自身が「使い手側の視点」をデータで持ち始めたという意味でも、Project Dealはひとつの転換点と言えます。