📅 2025年12月14日 ⏱️ 4分で読めます

AIエージェント運用Runbookとは？障害、例外、承認を回すための基本設計

執筆ファネルAi編集部編集ファネルAi編集部監修ファネルAi監修チーム最終更新2025年12月14日

AIエージェントを本番運用すると、プロンプトの出来より、止まった時にどう戻すかの方が重要になります。障害、例外入力、権限逸脱、承認待ちが起きたとき、誰がどう判断するかが曖昧だと運用はすぐ属人化します。

そこで必要になるのが運用Runbookです。Runbookは障害手順書ではなく、止める、戻す、承認する、再開する条件を明文化した運用設計として作るべきです。

本記事のポイント

これらは承認フローや Agent Evals と切り離せません。Runbookは単独文書ではなく、統制と評価の中間にある運用文書として考える方が実務的です。

Runbookの所有者は、開発者だけでは足りません。業務オーナー、運用管理者、承認者がそれぞれどこを見るかを分ける必要があります。

たとえば、開発者は復旧手順を、業務オーナーは止める基準を、管理者は承認ログと例外記録を持つ、といった分け方です。全員が同じ文書を見ても、担当箇所が分からなければ運用は回りません。

Runbookは最初に整えても、失敗事例が増えるたびに更新しなければ形骸化します。特に外部送信やCRM更新のような高リスク処理は、実際に起きた例外を反映していく方が現実的です。四半期ごとでもよいので、失敗ケースと停止基準を見直す場を持つべきです。

障害、例外、承認、再開の4領域を最低限書くべきです。

障害は止まった状態、例外時は動いているが判断を続けてはいけない状態として分けると整理しやすくなります。

誰が承認するか、どこで記録するか、承認がない場合は何を止めるかまで明文化すべきです。

失敗ケースや例外対応が増えるたびに追記し、評価セットと一緒に更新するのが有効です。