Claude Codeのコスト管理を表す棒グラフと利用上限プログレスバー、虫眼鏡のイラスト

記事

Claude Codeのコストと利用上限を確認する方法：/usageコマンドの読み方と節約手段

Claude Codeの利用料金と上限を確認する/usageコマンド（/cost・/statsはエイリアス）の読み方、/usage-creditsでの上限管理、Anthropic Consoleでのワークスペース上限、TPM/RPM推奨、Agent Teamsを含む節約手段までを公式仕様に沿って整理します。

Claude Codeのコスト確認は、現在では/usageコマンド1つに集約されています。/costと/statsは公式コマンドリファレンス上/usageのエイリアスで、別機能ではありません。/extra-usageは/usage-creditsに改名されており、上限到達時の利用クレジット設定はこちらを使います。

この記事では結論先出しで、/usageの画面の読み方、プラン別の見え方、チームでのコスト管理、そして「実際に減らす」ためのトークン節約手段までを公式情報ベースに整理します。長く使うほど効くのは「節約手段の習慣化」のほうで、/usageはあくまで現状把握の入口です。

/usage、/cost、/stats、/usage-creditsの関係

まず用語を整理しておきます。コマンドリファレンスの記述に沿うと、4つの関係は次のとおりです。

コマンド	役割
`/usage`	セッションコスト、プラン利用上限、アクティビティ統計を表示する主コマンド
`/cost`	`/usage`のエイリアス（公式リファレンスで明記）
`/stats`	`/usage`のエイリアス。Statsタブを開いた状態で起動する
`/usage-credits`	上限到達時の継続利用クレジット設定。以前は`/extra-usage`

つまり「コスト確認系のコマンド」は実質1つで、入口が複数あると考えればよく、/costや/extra-usageを覚えていた人もそのまま動きます。Pro/Max/Team/Enterpriseの加入者は/usageの同じ画面でプラン利用バーやアクティビティ統計、Skills・サブエージェント・プラグイン・MCPサーバーごとの利用内訳まで見られます。

/usageの「Sessionブロック」の読み方

/usageを起動するとまずSessionブロックが表示されます。これは現在のセッションでのトークン使用統計と推定コストで、画面上は次のような4行で並びます。

Total cost:            $0.55
Total duration (API):  6m 19.7s
Total duration (wall): 6h 33m 10.2s
Total code changes:    0 lines added, 0 lines removed

ここで重要なのはSessionブロックのTotal costはAPI利用者向けの目安である点です。Claude Maxやプロのサブスク加入者にとっては「使った分」はサブスク料に含まれているので、$表示は請求額と一致しません。正式な請求情報を見たい場合はClaude ConsoleのUsageページが情報源になります。

API直接利用（Bedrock/Vertex/Foundryではない、Anthropic API）であれば、Total duration (API)が実際にAPIを呼んでいた時間、Total duration (wall)が壁時計の経過時間です。差分が大きいほど「会話を開いたまま放置した時間」が長いことを意味し、自分のスタイルを見直す材料になります。

プラン利用バーとアクティビティ統計

/usageはSubscriptionプランでは画面下にプラン利用バーを表示します。dキーで直近24時間、wキーで直近7日間に切り替えられます。サブスク加入者にとってはこちらのほうが実用的で、リセットされる前にどれくらい使ったかが一目で分かります。

公式は「数値は概算で、このマシンのローカルセッション履歴から計算している」と明示しています。つまり他のマシンやclaude.aiの利用は含まれません。複数マシンで使っている場合は、合算ベースの集計はClaude Consoleで確認することになります。

Pro/Max/Team/Enterpriseで便利なのが直近利用の内訳表示で、Skills、サブエージェント、プラグイン、MCPサーバーごとに割合がパーセンテージで表示されます。「最近遅い」「想定より早く上限に達する」といったときに、原因のMCPサーバーやサブエージェント定義を絞り込めます。あわせて/contextで何がコンテキストを食っているかも見ると、節約ポイントが具体化します。

/usage-creditsで上限到達後も止まらない設計

Pro/Maxプランには月次のUsage credit上限を設定する仕組みがあります。これは/usage-creditsコマンドで設定可能で、上限に達したときにClaude Codeから「上限を引き上げるか、解除するか」のプロンプトが出て、CLIから離脱せずに継続できます。

上限変更にはアカウントの請求権限が必要なので、チーム利用では権限を持つ管理者と事前に運用方針を決めておきます。「クレジットを使い切ったら停止」「クレジットを使い切っても自動で継続」のどちらにするかは、チームの予算管理スタイル次第です。なお、/usage-creditsは以前は/extra-usageという名前で、過去記事や社内ドキュメントの参照は新名称に統一しておくと迷いがなくなります。

チームとAPI直接利用の予算管理

Claude API経由で使うチームは、ワークスペース単位の支出上限を設定できます。Anthropic Consoleの初回認証時に「Claude Code」という専用ワークスペースが自動生成され、組織内の全Claude Code利用のコストが集約されます。このワークスペースではAPIキーを発行できず、Claude Code認証専用のコンテナとして機能します。

カスタムレート制限がある組織では、Claude Code利用ぶんが組織全体のAPIレート制限を消費します。本番ワークロードに干渉させたくない場合は、ワークスペースのLimitsページからworkspace rate limitを設定して、Claude Codeの取り分を別途キャップします。

公式のコスト記事は組織規模ごとのTPM/RPM推奨も提示しています。

チーム規模	1ユーザあたりTPM	1ユーザあたりRPM
1-5名	200k-300k	5-7
5-20名	100k-150k	2.5-3.5
20-50名	50k-75k	1.25-1.75
50-100名	25k-35k	0.62-0.87
100-500名	15k-20k	0.37-0.47
500+名	10k-15k	0.25-0.35

大規模になるほど1人あたりが下がるのは「全員が同時には使わない」前提のためで、これらはユーザー単位ではなく組織レベルで適用される総量制限を意味します。個人ユーザーは他人が使っていない時間帯に一時的にこの想定値を超えて消費でき、コスト効率を高められます。

Bedrock/Vertex/Foundry経由のClaude Codeはメトリクスを送信しないため、コスト把握にはLiteLLMなどのオープンソースゲートウェイで「キー単位の支出追跡」を導入している大企業事例があると紹介されています。Anthropicとの提携製品ではないため、利用前にセキュリティ評価が必要です。

トークンを「減らす」7つの実践手段

ここからが本題で、/usageはあくまで現状把握、減らすのは別物です。公式が挙げる手段を、優先度の高い順に整理します。

第1はコンテキストの能動管理です。タスクが切り替わったら/clearで会話を片付け、後で戻りたい場合は/renameしてから/clear、再開時は/resumeを使います。圧縮挙動を変えたいなら/compact Focus on test output and code changesのように焦点を指定します。CLAUDE.mdに常設の圧縮指示を書く運用も公式記事で紹介されています。

第2はモデル選択です。Sonnetはほとんどのコーディングタスクで十分かつOpusより安く、設計判断や複雑推論だけOpusに切り替えるのが王道です。/modelで動的に変更でき、サブエージェントはmodel: haikuを指定すれば探索系で大幅にコストを抑えられます。

第3はMCPサーバーの整理です。MCPツール定義は既定で遅延ロードされるためツール名だけがコンテキストに乗りますが、/contextを実行すると何が空間を食っているか確認できます。/mcpで設定済みサーバーを確認し、使っていないものは無効化します。可能ならCLIツール（gh、aws、gcloud等）に置き換えるとMCPのツール一覧コストもゼロになります。

第4はCode intelligenceプラグインの導入で、型付き言語ではシンボル単位のナビゲーションが使えるため、grepと複数ファイル読みの組み合わせを避けられます。第5はHooksでの前処理で、テスト出力やログをClaudeに見せる前にgrepで絞り込み、数万トークンを数百トークンに圧縮できます。第6はSkillsへの切り出しで、CLAUDE.mdに書いた手順をSkill化するとオンデマンドロードになり、関係ないタスクでは消費されなくなります。第7はExtended thinkingの調整で、/effortで深さを下げるか、MAX_THINKING_TOKENS=8000で予算を絞ります。

Hooksで「重い出力」を自動で軽くする

第5に挙げたHooksでの前処理は効果が大きいので具体例を出します。PreToolUseフックでBashコマンドの出力を絞ると、Claude側のコンテキスト消費を激減できます。settings.jsonに次のフックを登録します。

{
  "hooks": {
    "PreToolUse": [
      {
        "matcher": "Bash",
        "hooks": [
          {
            "type": "command",
            "command": "~/.claude/hooks/filter-test-output.sh"
          }
        ]
      }
    ]
  }
}

呼ばれるスクリプトはコマンドを変換するだけのシンプルなものでよく、たとえば「テストコマンドだけgrep -E '(FAIL|ERROR|error:)'で絞る」とします。

#!/bin/bash
input=$(cat)
cmd=$(echo "$input" | jq -r '.tool_input.command')

if [[ "$cmd" =~ ^(npm test|pytest|go test) ]]; then
  filtered_cmd="$cmd 2>&1 | grep -A 5 -E '(FAIL|ERROR|error:)' | head -100"
  echo "{\"hookSpecificOutput\":{\"hookEventName\":\"PreToolUse\",\"permissionDecision\":\"allow\",\"updatedInput\":{\"command\":\"$filtered_cmd\"}}}"
else
  echo "{}"
fi

この種のフィルタを2〜3個用意するだけで、「テスト結果を貼り付ける」「ログを貼り付ける」系のタスクで実コンテキスト消費が桁違いに変わります。

Agent Teams利用時の追加コスト

Agent Teamsはチーム全体でトークン消費が膨らみがちな機能で、公式は「ティームメイトがプランモードで動くとき、標準セッション比でおよそ7倍のトークンを消費する」と明示しています。これは各メイトが独立コンテキストを持ち、別Claudeインスタンスとして走るためです。

具体的な抑制策は次の4点に絞られます。

メイトにはSonnetを使う（協調タスクでバランスが最も良い）
チームは小さく保つ（消費は人数にほぼ比例する）
スポーンプロンプトは絞る（CLAUDE.md/MCP/Skillsは自動ロードされるので追加情報のみ書く）
作業終了時に必ずクリーンアップする（アイドルでも消費は続く）

/usageを後でチェックして、想定以上に高かったらチームサイズを次回から下げる、というフィードバックループを回すと、適切なサイズが見えてきます。

バックグラウンド消費とバージョン依存

/usageの値を見て「使っていないはずなのに小さい消費がある」と感じる場合があります。これは公式が明記しているバックグラウンド消費で、会話のサマリ生成（claude --resume用）や、/usage自体のステータスチェックなどが該当します。1セッションあたり通常0.04ドル未満で、運用上気にする規模ではありません。

機能やコスト表示の挙動は更新で変わることがあります。挙動が変わったと感じたらバージョンを確認します。

claude --version

特定の請求に関する疑問は、Claude ConsoleからAnthropicサポートに問い合わせるのが公式の窓口です。