agent-architecture-audit
Officialエージェントおよび LLM アプリケーション向けのフルスタック診断。12 層のエージェントスタックにおけるラッパーリグレッション、メモリ汚染、ツール規律の失敗、隠れた修復ループ、レンダリング破損を監査します。重要度順の発見事項とコードファーストの修正を生成します。エージェントアプリケーション、自律ループ、または LLM を活用した機能を構築する開発者に必須です。
What this skill does
When applied, it prepends a system prompt before your request is sent — no extra calls and no change to how you are billed beyond the added tokens.
--- name: agent-architecture-audit description: エージェントおよび LLM アプリケーション向けのフルスタック診断。12 層のエージェントスタックにおけるラッパーリグレッション、メモリ汚染、ツール規律の失敗、隠れた修復ループ、レンダリング破損を監査します。重要度順の発見事項とコードファーストの修正を生成します。エージェントアプリケーション、自律ループ、または LLM を活用した機能を構築する開発者に必須です。 origin: oh-my-agent-check tools: Read, Write, Edit, Bash, Grep, Glob --- # エージェントアーキテクチャ監査 ラッパー層、古いメモリ、リトライループ、トランスポート・レンダリングの変異の背後に失敗を隠すエージェントシステムのための診断ワークフロー。 ## 起動タイミング **必須の場合:** - エージェントまたは LLM を活用したアプリケーションを本番リリースする前 - ツール呼び出し、メモリ、または多段階ワークフローを含む機能をリリースする前 - ラッパー層を追加した後にエージェントの動作が低下する場合 - ユーザーが「エージェントが悪化している」または「ツールが不安定」と報告する場合 - 同じモデルがプレイグラウンドでは動作するがラッパー内で壊れる場合 - 根本原因を見つけることなく 15 分以上エージェントの動作をデバッグしている場合 **特に重要な場合:** - 新しいプロンプト層、ツール定義、またはメモリシステムを追加した場合 - システム内の異なるエージェントが一貫性なく動作する場合 - 昨日は正常だったモデルが今日ハルシネーションを起こしている場合 - 応答をサイレントに変異させる隠れた修復・リトライループが疑われる場合 **使用しない場合:** - 一般的なコードデバッグ — `agent-introspection-debugging` を使用 - コードレビュー — 言語固有のレビューエージェントを使用 - セキュリティスキャン — `security-review` または `security-review/scan` を使用 - エージェントパフォーマンスのベンチマーク — `agent-eval` を使用 - 新機能の作成 — 適切なワークフロースキルを使用 ## 12 層スタック すべてのエージェントシステムはこれらの層を持ちます。いずれも回答を破壊する可能性があります: | # | 層 | 問題の内容 | |---|-------|----------------| | 1 | システムプロンプト | 矛盾する指示、指示の肥大化 | | 2 | セッション履歴 | 前のターンからの古いコンテキスト注入 | | 3 | 長期メモリ | セッション間の汚染、新しい会話に古いトピックが混入 | | 4 | 蒸留 | 圧縮されたアーティファクトが疑似事実として再投入 | | 5 | アクティブリコール | コンテキストを無駄にする冗長な再要約層 | | 6 | ツール選択 | 誤ったツールルーティング、モデルが必要なツールをスキップ | | 7 | ツール実行 | ハルシネーションによる実行 — 呼び出したと主張するが実際には呼び出していない | | 8 | ツール解釈 | ツール出力の誤読または無視 | | 9 | 回答整形 | 最終応答でのフォーマット破損 | | 10 | プラットフォームレンダリング | トランスポート層の変異(UI、API、CLI が有効な回答を変異させる) | | 11 | 隠れた修復ループ | サイレントなフォールバック・リトライエージェントが 2 回目の LLM パスを実行 | | 12 | 永続化 | 期限切れの状態またはキャッシュされたアーティファクトがライブエビデンスとして再利用 | ## 一般的な障害パターン ### 1. ラッパーリグレッション ベースモデルは正しい回答を生成するが、ラッパー層がそれを悪化させる。 **症状:** - プレイグラウンドや直接 API 呼び出しでは正常に動作するが、エージェント内で壊れる - 新しいプロンプト層を追加したら既存の動作が低下した - エージェントは自信を持っているが、自信を持って間違っている - 「最後のアップデート前は動作していた」 ### 2. メモリ汚染 履歴、メモリ検索、または蒸留を通じて古いトピックが新しい会話に漏れる。 **症状:** - エージェントが無関係な過去のトピックを持ち出す - ユーザーの修正が定着しない(古いメモリが新しいものを上書きす
Use this skill
Add a "skill" field with the skill’s ID to your chat completion request. It is applied server-side before your prompt is sent — no extra calls.
{
"model": "gpt-4o-mini",
"skill": "imp-b3cef8d1-c8aa-4e8b-944e-32594710bf6b",
"messages": [{ "role": "user", "content": "…" }]
}Install the skill, enable it in your dashboard and (optionally) limit it to specific models. It then applies automatically to every matching request — with no "skill" field to send each time.
Set it up in your dashboardMore skills
Set up and use 1Password CLI for sign-in, desktop integration, and reading or injecting secrets.
Create, view, edit, delete, search, move, or export Apple Notes via the memo CLI on macOS.
List, add, edit, complete, or delete Apple Reminders and reminder lists via remindctl.
Create, search, and manage Bear notes via grizzly CLI.
Monitor blogs and RSS/Atom feeds for updates using the blogwatcher CLI.
BluOS CLI (blu) for discovery, playback, grouping, and volume.
Capture frames or clips from RTSP/ONVIF cameras.
Search, install, update, sync, or publish agent skills with the ClawHub CLI and registry.