AIエージェントにおけるハーネスとスキルの違いとは?Claude Code・Codex運用で役割分担を整理する
Claude Code や Codex の説明で「ハーネス」「スキル」という言葉が出てくると、モデル、MCP、AGENTS.md、system prompt まで一気に混ざりがちです。すると「どのモデルが賢いか」だけを比べてしまい、実際には権限、接続先、再利用手順が弱くて運用が定着しない、というズレが起きます。
結論から言うと、ハーネスは AI エージェントを実務で動かす実行基盤、スキルは特定タスクを安定して進める再利用パッケージです。モデルが考える中核で、ハーネスが行動範囲を決め、スキルが進め方をそろえる、と分けると理解しやすくなります。
本記事のポイント
- ハーネスはツール、権限、実行環境、ルール注入を含む実行基盤であり、スキルは特定業務を安定して進める再利用手順です。
- Claude CodeやCodexの導入判断は、モデル性能だけでなく、どのハーネスで何に接続でき、どこまで実行できるかで決まります。
- MCP、AGENTS.md、Runbook、監査ログまで含めて整理すると、単発の便利体験を継続運用へ変えやすくなります。
この記事で扱うテーマ
関連キーワード
- ハーネス スキル 違い
- Claude Code Codex ハーネス
- AIエージェント スキル とは
- AGENTS ファイル MCP 位置づけ
- AIエージェント 実行基盤
このページで答える質問
- ハーネスとスキルの違いは何ですか?
- Claude CodeやCodexでハーネスとは何を指しますか?
- MCPやAGENTS.mdはどこに位置づきますか?
- AIエージェント導入では何から整えるべきですか?
このテーマを整理したい場面
- Claude Code や Codex の違いを、モデル性能だけで比較してしまっている
- MCP、AGENTS.md、スキル、Runbook が同じ階層の概念に見えている
- 一度うまくいった自動化が、次回は再現できずチーム展開できない
比較の起点は「どのモデルか」だけではなく、「どんな実行基盤で」「どんな再利用単位で」運用するかです。
一番短い定義は「何ができるか」と「どうやるか」の違い
ハーネスとスキルの違いは、実務では「何ができるか」と「どうやるか」を分けると理解しやすくなります。モデルだけでは思考しかできません。そこに実行基盤と再利用手順が乗って初めて、AIエージェントは仕事として成立します。
| 層 | 主な役割 | 代表的な問い |
|---|---|---|
| モデル | 推論、文章生成、構造化出力 | 何を考え、どう答えるか |
| ハーネス | ツール、権限、実行環境、ルール注入、ログ | 何に触れ、どこまで実行できるか |
| スキル | 再利用手順、参照ドキュメント、補助スクリプト | その仕事をどう進めるか |
| MCP | 外部SaaSやデータへの接続インターフェース | 何とつながるか |
| プロジェクトルール | 命名、禁止事項、必須手順、公開前確認 | この現場では何を守るか |
この整理で見ると、ハーネスはスキルの上位概念です。スキルが優秀でも、ハーネスに必要なツールや権限がなければ実行できません。逆にハーネスだけ整っていても、スキルがなければ毎回ゼロから手順を考えるため、同じ依頼でも品質が揺れます。
Claude CodeやCodexでハーネスに含めて見るべき要素
Claude Code や Codex を選ぶとき、実務上まず見るべきなのは「どのモデルか」より「どんなハーネスで動くか」です。ハーネスに含めて考えると整理しやすい要素は次の通りです。
| 要素 | 見るべき内容 | 弱いと起きること |
|---|---|---|
| ツール | shell、git、web、connector、MCP、ローカルファイル | 考えられても実行できない |
| 権限 | read/write 範囲、network 可否、approval policy | 事故が怖くて本番投入できない |
| 文脈注入 | repo、workspace、履歴、AGENTS.md、system rule | 毎回ルール説明が必要になる |
| 実行面 | 差分確認、テスト、ログ、コメント、レビュー導線 | 結果の追跡や再現が難しくなる |
つまり、Claude Code と Codex の比較では「どちらが賢そうか」だけでは足りません。repo を触るのか、CLI を叩くのか、browser をまたぐのか、MCP や connector をどこまで安全に扱えるのか、といったハーネス差が運用差になります。ツール比較そのものを深掘りしたい場合は OpenAI Codexの業務自動化 や Claude CodeとClaude Coworkの違い もあわせて見ると判断しやすくなります。
スキルは prompt 集ではなく、再利用できるworkflowの単位
スキルを単なる prompt の断片だと考えると、再利用性が弱くなります。実務でいうスキルは、対象タスク、参照すべき文書、使うスクリプト、検証順、出力形式まで含んだ「仕事の型」です。
| スキルに入るもの | 理由 |
|---|---|
| いつ使うかの条件 | 適用範囲が曖昧だと毎回手順がぶれる |
| 参照文書と読む順番 | 初見でも同じ判断順で動ける |
| 補助スクリプトやテンプレート | 手作業やコピペを減らせる |
| 検証と公開前チェック | 一度の成功を継続運用へ変えやすい |
スキルがない状態では、AIエージェントは毎回ゼロから「どう進めるか」を考えます。そのため、一度はうまくいっても、担当者や依頼文が変わると結果が揺れます。チームで回すなら、マーケティングチームのAIワークフロー のように、承認、引き継ぎ、振り返りまで含めて型にする方が安定します。
MCPとAGENTS.mdはどこに位置づくか
ここが最も混乱しやすい部分です。MCP と AGENTS.md は、どちらも「エージェントに追加情報を渡すもの」に見えますが、役割は違います。MCP は接続の仕組み、AGENTS.md はその現場で守るべきローカルルールです。
| 項目 | 位置づけ | 主な役割 |
|---|---|---|
| MCP | ハーネス配下の接続層 | 外部ツールやSaaSへ安全に触る入口をそろえる |
| AGENTS.md | プロジェクト固有ルール | 命名、禁止事項、必須コマンド、公開前確認を固定する |
| Runbook | 運用ルール | 例外時に誰が止め、どう戻すかを明文化する |
たとえば CRM や Google Workspace を AI エージェントが触る場合、まず必要なのは接続インターフェースとしての MCP です。これは API経由・MCP経由で操作するCRM の論点です。一方で、本番運用に入れるなら権限、承認、記録をまとめた AIエージェントのガバナンス と、止め方と戻し方を定義する AIエージェント運用Runbook まで必要になります。
つまり、MCP は「何とつなぐか」、AGENTS.md は「この現場で何を守るか」、Runbook は「問題が起きたときにどう運用するか」です。どれも大事ですが、同じものではありません。
導入判断はモデル比較より前に4段階で見る
Claude Code や Codex を導入するなら、比較の順番を逆にしない方が失敗しにくくなります。先に見るべきなのは次の4段階です。
- どの surface で仕事を進めるか。repo / terminal 中心なのか、desktop / browser 中心なのか。
- 何につなぐか。ローカルファイルだけで済むのか、CRM、Gmail、Sheets、deploy 環境まで触るのか。
- どこまで実行してよいか。read/write 権限、承認、監査ログ、例外時の停止条件をどう置くか。
- 何を再利用するか。同じ仕事が繰り返されるなら、スキルとして型を切り出せるか。
この4段階を整理してから、最後にモデルや製品比較へ進む方が本番運用に入りやすくなります。逆に、モデルだけ先に選ぶと、「賢いが現場では使えない」状態になりやすくなります。
よくある失敗パターン
| 失敗パターン | 起きる理由 | 見直し方 |
|---|---|---|
| モデル比較だけで導入を決める | ハーネス差を見落とし、必要な実行や接続ができない | ツール、権限、接続先、レビュー導線を先に棚卸しする |
| スキルを prompt 集のまま運用する | 文書、スクリプト、検証順が固定されず再現性が落ちる | 対象タスク、参照文書、検証順までまとめて型にする |
| AGENTS.mdに全部詰め込む | 現場ルールと再利用workflowが混ざり、読みづらくなる | ローカルルールとスキルを分離し、役割を分ける |
| MCPをつないで終わる | 承認、Runbook、監査がなく本番投入できない | 接続後にガバナンスと運用手順を整える |
要するに、ハーネスは「できる範囲」、スキルは「うまくやる型」、MCP は「つながる先」、AGENTS.md は「この現場の制約」です。この階層を混ぜないことが、AIエージェント運用の第一歩になります。
よくある質問
ハーネスとMCPは同じですか?
同じではありません。ハーネスは実行基盤全体で、MCP はその中の接続層です。MCP があっても、権限や承認やログが弱ければ安全には運用できません。
AGENTS.mdはスキルですか?
通常は別です。AGENTS.md はプロジェクト固有のローカルルールであり、スキルは複数の依頼で再利用する仕事の型です。両者を分けると保守しやすくなります。
最初に整えるべきなのはハーネスとスキルのどちらですか?
先にハーネスです。必要なツール、権限、接続先がないと、どんなスキルも実行できません。その上で、繰り返し使う業務から 1 つか 2 つスキル化すると定着しやすくなります。
prompt 集だけでも十分ですか?
十分ではありません。再利用性を高めるには、参照文書、補助スクリプト、検証順、出力形式まで含めてスキルとしてまとめる方が効果的です。