Claude Codeを使い続けていると、ふとした瞬間に「返答が長いな」と感じることがあります。調査を頼んだだけなのに、丁寧な前置きと箇条書きと要約がセットで返ってきて、気づけばトークンをかなり消費している、という状態です。
この記事では、出力の長さをプロンプト一行でコントロールする「Cavemanプロンプト」という手法を紹介します。何に効いて、何に向かないかを整理したうえで、実際の使い方と設定方法までお伝えします。「返答を短くするだけで、本当に制限対策になるの?」という疑問にも正直に答えます。
虹野ネオン返答が長い、ってあるあるですよね。調査を頼んだだけなのに、すごく丁寧な解説がついてきて、読むだけで疲れてしまって……
-150x150.png)
-150x150.png)
-150x150.png)
力の長さをコントロールする工夫はあります。ただ、全体の使用量が一気に減るわけではないので、何に効くかを先に整理しておくのが大事です
Claude Codeはなぜトークンを多く使うのか


Claude Codeがトークンを消費する経路は、大きく二つあります。
入力側:会話の履歴・読み込んだファイル・コンテキスト全体がそのまま毎回入力として使われます。セッションが長くなるほど、過去のやり取りが積み重なってトークンが増えていきます。
出力側:Claudeが返す文章そのものです。「要点だけ教えて」と思っているのに、説明・箇条書き・まとめ・補足、という構成で返ってくることがよくあります。
利用制限(使用量の上限)は、メッセージの長さ・使用モデル・ツールの利用状況など複合的な要因で決まります。Cavemanプロンプトが直接コントロールできるのは、このうち「出力トークン」の部分です。入力側のトークン増加には別の対策が必要です。
この前提を押さえておくと、次の「どこまで効くか」の話が具体的に理解できます。
Cavemanプロンプトとは何か


Cavemanプロンプトは、「原始人のように短く話せ」という指示をClaude Codeに与えることで、出力の長さを削る手法です。
名前の由来はそのままで、原始人(Caveman)の話し方を模倣させます。「many word bad. short good. code > words.」のようなスタイルで返答させることで、余分な前置き・繰り返し・感想を省いた出力になります。
GitHubで公開されているリポジトリ(JuliusBrussee/caveman)が発端で、Claude Codeユーザーの間で広まった手法です。原始人語のような英語表現でなくても、「短く、結論だけ」という日本語の指示でも同様の効果が出ます。
わたし自身がマーコットAIブログ運用でClaude Codeを使う中でこれを導入した感想は、「調査や整理タスクなら、内容の質を落とさずに返答が短くなる」というものです。短い返答は読みやすく、次の指示を出すテンポも上がります。ただし、すべての作業に向くわけではありません(後述します)。
「75%削減」はどこまで本当か
Cavemanプロンプトを紹介するページでは「75%削減」「65%削減」「40%削減」といった数字が並んでいます。
元になっているのはGitHubリポジトリの報告値です。たとえば、JuliusBrussee/caveman では65%削減、carlosduplar/caveman-output-style-claude-code では40%削減と記載されています。実測では22%〜87%と幅があり、タスクの種類・プロンプトの長さ・モデルによって大きく変わります。
ここで注意が必要な点が二つあります。
一つ目は、削減されるのは出力トークンのみという点です。入力トークン(ファイル読み込み・会話履歴)は対象外です。「Claude Code全体の使用量が大幅に減る」という話ではありません。
二つ目は、利用制限への効果は限定的という点です。公式ヘルプによれば制限は複合的な要因で決まるため、出力トークンだけを減らしても確実に回避できるわけではありません。「一定の効果がある可能性がある」というのが正直なところです。
効果の受け取り方として、「最大で大きく削れるケースがある」という理解が適切です。大幅削減を前提に作業計画を立てるより、「余分な出力を減らす習慣をつける」という感覚で使うのが現実的です。


-150x150.png)
-150x150.png)
-150x150.png)
65%とか75%って数字が並んでいたので、全部まとめて使用量が減るのかと思っていました
-150x150.png)
-150x150.png)
-150x150.png)
減るのは出力トークンだけです。入力側の会話履歴やファイルは別問題なので、そこは混同しないようにしておくと使い方がクリアになります
実際に使うプロンプト例
使い方は主に二通りあります。
① CLAUDE.mdに書いて自動適用する
CLAUDE.mdというプロジェクト設定ファイルに以下のような記述を追加すると、そのプロジェクトでの作業時に自動でスタイルが適用されます。
## 応答スタイル(Cavemanモード)
調査・整理・チェック時:
- 返答は短く。前置き・感想・挨拶は不要。
- 最初に結論。根拠は箇条書きで。
わたし自身、マーコットAIブログ運用用のCLAUDE.mdにこの設定を入れています。調査や整理タスクで「返答が長すぎてテンポが落ちる」と感じていたのが、設定後から改善されました。


② 会話の中でその都度指定する
特定のタスクだけ短くしたい場合は、指示の冒頭に一行追加します。
短く答えて。結論だけ。
箇条書きで3点以内にまとめて。前置き不要。
厳格なCaveman形式(「Caveman speak only」など英語での指定)でなくても、返答を短くする効果は十分に出ます。日本語で「短く、結論だけ」と書くだけで機能します。
向いている作業・向いていない作業
Cavemanモードが効果的なのは、「判断の中身は必要だが、言い回しは不要」なタスクです。
向いている作業
- ファクトチェック(情報の鮮度確認・数字の根拠確認)
- 重複チェック、矛盾のリストアップ
- 箇条書きでの整理・要約
- コードのレビューや問題点の列挙
- 調査・候補出し
向いていない作業
- ブログ記事・ノウハウ図書館の本文執筆
- 導入・まとめなど読者に語りかける文章
- やわらかい文体が必要なコンテンツ全般
執筆系のタスクでCavemanモードを使うと、文章が事務的・冷たい印象になります。読者に届ける文章は通常モードで書くのが基本です。作業の性質によって使い分けることが、品質を保つうえで重要です。


-150x150.png)
-150x150.png)
-150x150.png)
記事の本文には使えないんですね。チェックや調査だけ、というのが少し限定的に感じます
-150x150.png)
-150x150.png)
-150x150.png)
記事本文を短くしてしまうと本末転倒になるわ。本文は丁寧に書く必要があるので、チェック系だけ軽くなるだけでも作業全体のテンポは変わります
マーコットAIブログの記事作成で使うなら、工程を分ける
このブログを例にとると、記事一本を作るまでに「調査・整理フェーズ」と「執筆フェーズ」があります。
Cavemanモードを使う工程
- ファクトチェック(FC)
- 既存記事との重複チェック
- デビルチェック(弱点・離脱リスクの洗い出し)
- 構成案の確認・修正点の列挙
Cavemanモードを解除する工程
- 導入・本文・まとめの執筆
- ノウハウ図書館向けリライト
- X投稿文・つぶやき文の作成
切り替えの方法は簡単です。CLAUDE.mdに「調査・整理時はCavemanモード、執筆時は解除」と明記しておくだけです。
実際にこの運用を始めてから、調査フェーズで返答が短くなり作業テンポが上がる一方、執筆フェーズでは通常文体に戻ることを確認しています。工程ごとに使い分けることで、テンポと品質を両立できます。


なお、使用量の節約という観点では、制限の仕組み全体を解説した別記事「Claudeの使用量を節約する方法|5時間制限・週次制限の仕組みと今すぐできる対処法」も参考にしてください。仕組みを理解したうえでCavemanプロンプトを組み合わせると、より効果的に運用できます。
- Cavemanプロンプトは、Claude Codeの出力トークンを削減するための手法
- 削減率は条件によって幅があり(実測22〜87%)、「最大で大きく削れるケースがある」という理解が適切
- 利用制限への効果は限定的。「出力を短くする習慣をつける」感覚で使う
- CLAUDE.mdに記述すれば自動適用できる。日本語の指示でも十分機能する
- 向いているのは調査・整理・チェック系のタスク。執筆系は通常モードを維持する
- 「工程ごとに切り替える」運用が、テンポと品質の両立につながる









コメント