All skills

agent-harness-construction

Official
by Api.AirforcePrepends a system promptAI & Agent Building000 uses202,700

设计和优化AI代理的动作空间、工具定义和观察格式,以提高完成率。

open-sourceclaude-codeai-agent-buildingaffaan-m
Share

What this skill does

When applied, it prepends a system prompt before your request is sent — no extra calls and no change to how you are billed beyond the added tokens.

---
name: agent-harness-construction
description: 设计和优化AI代理的动作空间、工具定义和观察格式,以提高完成率。
origin: ECC
---

# 智能体框架构建

当你在改进智能体的规划、调用工具、从错误中恢复以及收敛到完成状态的方式时,使用此技能。

## 核心模型

智能体输出质量受限于:

1. 行动空间质量
2. 观察质量
3. 恢复质量
4. 上下文预算质量

## 行动空间设计

1. 使用稳定、明确的工具名称。
2. 保持输入模式优先且范围狭窄。
3. 返回确定性的输出形状。
4. 除非无法隔离,否则避免使用全能型工具。

## 粒度规则

* 对高风险操作(部署、迁移、权限)使用微工具。
* 对常见的编辑/读取/搜索循环使用中等工具。
* 仅当往返开销是主要成本时使用宏工具。

## 观察设计

每个工具响应都应包括:

* `status`: success|warning|error
* `summary`: 一行结果
* `next_actions`: 可执行的后续步骤
* `artifacts`: 文件路径 / ID

## 错误恢复契约

对于每个错误路径,应包括:

* 根本原因提示
* 安全重试指令
* 明确的停止条件

## 上下文预算管理

1. 保持系统提示词最少且不变。
2. 将大量指导信息移至按需加载的技能中。
3. 优先引用文件,而不是内联长文档。
4. 在阶段边界处进行压缩,而不是任意的令牌阈值。

## 架构模式指导

* ReAct:最适合路径不确定的探索性任务。
* 函数调用:最适合结构化的确定性流程。
* 混合模式(推荐):ReAct 规划 + 类型化工具执行。

## 基准测试

跟踪:

* 完成率
* 每项任务的重试次数
* pass@1 和 pass@3
* 每个成功任务的成本

## 反模式

* 太多语义重叠的工具。
* 不透明的工具输出,没有恢复提示。
* 仅输出错误而没有后续步骤。
* 上下文过载,包含不相关的引用。

Use this skill

Per request

Add a "skill" field with the skill’s ID to your chat completion request. It is applied server-side before your prompt is sent — no extra calls.

{
  "model": "gpt-4o-mini",
  "skill": "imp-3ad998b8-21ce-44f7-aae4-7e7cc5f4e395",
  "messages": [{ "role": "user", "content": "…" }]
}
Always on — no field to send

Install the skill, enable it in your dashboard and (optionally) limit it to specific models. It then applies automatically to every matching request — with no "skill" field to send each time.

Set it up in your dashboard