📅 2025年2月18日 ⏱️ 8分で読めます

AIエージェントにおけるハーネスとスキルの違いとは？Claude Code・Codex運用で役割分担を整理する

執筆小林編集ファネルAi編集部監修ファネルAi監修チーム最終更新2026年4月18日

モデルのコアを中心に、ハーネスとMCPの接続層、下段に再利用スキルが配置された階層構造の図

Claude Code や Codex の説明で「ハーネス」「スキル」という言葉が出てくると、モデル、MCP、AGENTS.md、system prompt まで一気に混ざりがちです。すると「どのモデルが賢いか」だけを比べてしまい、実際には権限、接続先、再利用手順が弱くて運用が定着しない、というズレが起きます。

結論から言うと、ハーネスは AI エージェントを実務で動かす実行基盤、スキルは特定タスクを安定して進める再利用パッケージです。モデルが考える中核で、ハーネスが行動範囲を決め、スキルが進め方をそろえる、と分けると理解しやすくなります。

本記事のポイント

ハーネスはツール、権限、実行環境、ルール注入を含む実行基盤であり、スキルは特定業務を安定して進める再利用手順です。
Claude CodeやCodexの導入判断は、モデル性能だけでなく、どのハーネスで何に接続でき、どこまで実行できるかで決まります。
MCP、AGENTS.md、Runbook、監査ログまで含めて整理すると、単発の便利体験を継続運用へ変えやすくなります。

この記事で扱うテーマ

このテーマを整理したい場面

Claude Code や Codex の違いを、モデル性能だけで比較してしまっている
MCP、AGENTS.md、スキル、Runbook が同じ階層の概念に見えている
一度うまくいった自動化が、次回は再現できずチーム展開できない

比較の起点は「どのモデルか」だけではなく、「どんな実行基盤で」「どんな再利用単位で」運用するかです。

AIエージェント運用におけるモデル、ハーネス、スキル、MCP、プロジェクトルールの関係を整理した図 — モデルだけでなく、ハーネスが実行範囲を、スキルが進め方を、MCPとルールが接続先と制約を決めると整理すると導入判断がぶれにくくなります。

一番短い定義は「何ができるか」と「どうやるか」の違い

ハーネスとスキルの違いは、実務では「何ができるか」と「どうやるか」を分けると理解しやすくなります。モデルだけでは思考しかできません。そこに実行基盤と再利用手順が乗って初めて、AIエージェントは仕事として成立します。

層	主な役割	代表的な問い
モデル	推論、文章生成、構造化出力	何を考え、どう答えるか
ハーネス	ツール、権限、実行環境、ルール注入、ログ	何に触れ、どこまで実行できるか
スキル	再利用手順、参照ドキュメント、補助スクリプト	その仕事をどう進めるか
MCP	外部SaaSやデータへの接続インターフェース	何とつながるか
プロジェクトルール	命名、禁止事項、必須手順、公開前確認	この現場では何を守るか

この整理で見ると、ハーネスはスキルの上位概念です。スキルが優秀でも、ハーネスに必要なツールや権限がなければ実行できません。逆にハーネスだけ整っていても、スキルがなければ毎回ゼロから手順を考えるため、同じ依頼でも品質が揺れます。

Claude CodeやCodexでハーネスに含めて見るべき要素

Claude Code や Codex を選ぶとき、実務上まず見るべきなのは「どのモデルか」より「どんなハーネスで動くか」です。ハーネスに含めて考えると整理しやすい要素は次の通りです。

要素	見るべき内容	弱いと起きること
ツール	shell、git、web、connector、MCP、ローカルファイル	考えられても実行できない
権限	read/write 範囲、network 可否、approval policy	事故が怖くて本番投入できない
文脈注入	repo、workspace、履歴、AGENTS.md、system rule	毎回ルール説明が必要になる
実行面	差分確認、テスト、ログ、コメント、レビュー導線	結果の追跡や再現が難しくなる

つまり、Claude Code と Codex の比較では「どちらが賢そうか」だけでは足りません。repo を触るのか、CLI を叩くのか、browser をまたぐのか、MCP や connector をどこまで安全に扱えるのか、といったハーネス差が運用差になります。ツール比較そのものを深掘りしたい場合は OpenAI Codexの業務自動化や Claude CodeとClaude Coworkの違いもあわせて見ると判断しやすくなります。

スキルは prompt 集ではなく、再利用できるworkflowの単位

スキルを単なる prompt の断片だと考えると、再利用性が弱くなります。実務でいうスキルは、対象タスク、参照すべき文書、使うスクリプト、検証順、出力形式まで含んだ「仕事の型」です。

スキルに入るもの	理由
いつ使うかの条件	適用範囲が曖昧だと毎回手順がぶれる
参照文書と読む順番	初見でも同じ判断順で動ける
補助スクリプトやテンプレート	手作業やコピペを減らせる
検証と公開前チェック	一度の成功を継続運用へ変えやすい

スキルがない状態では、AIエージェントは毎回ゼロから「どう進めるか」を考えます。そのため、一度はうまくいっても、担当者や依頼文が変わると結果が揺れます。チームで回すなら、マーケティングチームのAIワークフローのように、承認、引き継ぎ、振り返りまで含めて型にする方が安定します。

MCPとAGENTS.mdはどこに位置づくか

ここが最も混乱しやすい部分です。MCP と AGENTS.md は、どちらも「エージェントに追加情報を渡すもの」に見えますが、役割は違います。MCP は接続の仕組み、AGENTS.md はその現場で守るべきローカルルールです。

項目	位置づけ	主な役割
MCP	ハーネス配下の接続層	外部ツールやSaaSへ安全に触る入口をそろえる
AGENTS.md	プロジェクト固有ルール	命名、禁止事項、必須コマンド、公開前確認を固定する
Runbook	運用ルール	例外時に誰が止め、どう戻すかを明文化する

たとえば CRM や Google Workspace を AI エージェントが触る場合、まず必要なのは接続インターフェースとしての MCP です。これは API経由・MCP経由で操作するCRM の論点です。一方で、本番運用に入れるなら権限、承認、記録をまとめた AIエージェントのガバナンスと、止め方と戻し方を定義する AIエージェント運用Runbook まで必要になります。

つまり、MCP は「何とつなぐか」、AGENTS.md は「この現場で何を守るか」、Runbook は「問題が起きたときにどう運用するか」です。どれも大事ですが、同じものではありません。

導入判断はモデル比較より前に4段階で見る

Claude Code や Codex を導入するなら、比較の順番を逆にしない方が失敗しにくくなります。先に見るべきなのは次の4段階です。

どの surface で仕事を進めるか。repo / terminal 中心なのか、desktop / browser 中心なのか。
何につなぐか。ローカルファイルだけで済むのか、CRM、Gmail、Sheets、deploy 環境まで触るのか。
どこまで実行してよいか。read/write 権限、承認、監査ログ、例外時の停止条件をどう置くか。
何を再利用するか。同じ仕事が繰り返されるなら、スキルとして型を切り出せるか。

この4段階を整理してから、最後にモデルや製品比較へ進む方が本番運用に入りやすくなります。逆に、モデルだけ先に選ぶと、「賢いが現場では使えない」状態になりやすくなります。

よくある失敗パターン

失敗パターン	起きる理由	見直し方
モデル比較だけで導入を決める	ハーネス差を見落とし、必要な実行や接続ができない	ツール、権限、接続先、レビュー導線を先に棚卸しする
スキルを prompt 集のまま運用する	文書、スクリプト、検証順が固定されず再現性が落ちる	対象タスク、参照文書、検証順までまとめて型にする
AGENTS.mdに全部詰め込む	現場ルールと再利用workflowが混ざり、読みづらくなる	ローカルルールとスキルを分離し、役割を分ける
MCPをつないで終わる	承認、Runbook、監査がなく本番投入できない	接続後にガバナンスと運用手順を整える

要するに、ハーネスは「できる範囲」、スキルは「うまくやる型」、MCP は「つながる先」、AGENTS.md は「この現場の制約」です。この階層を混ぜないことが、AIエージェント運用の第一歩になります。

よくある質問

ハーネスとMCPは同じですか？

同じではありません。ハーネスは実行基盤全体で、MCP はその中の接続層です。MCP があっても、権限や承認やログが弱ければ安全には運用できません。

AGENTS.mdはスキルですか？

通常は別です。AGENTS.md はプロジェクト固有のローカルルールであり、スキルは複数の依頼で再利用する仕事の型です。両者を分けると保守しやすくなります。

最初に整えるべきなのはハーネスとスキルのどちらですか？

先にハーネスです。必要なツール、権限、接続先がないと、どんなスキルも実行できません。その上で、繰り返し使う業務から 1 つか 2 つスキル化すると定着しやすくなります。

prompt 集だけでも十分ですか？

十分ではありません。再利用性を高めるには、参照文書、補助スクリプト、検証順、出力形式まで含めてスキルとしてまとめる方が効果的です。

メディア一覧へ戻る