这是什么
这两份是为 Agent Harness 改造 做的前期调研。改造的对象是 Cobuilder 当前驱动 Agent 干活的那套「壳」——提示词约束、CLI 命令、确认门、权限黑名单等。
核心思想很朴素:要改造一个东西,得先彻底理解它。动手改之前,先把它现在「实际是怎么用的」和「实际是怎么管的」摸清楚,避免凭印象改、改错地方。
于是从两个角度各做了一份盘点——一份看真实使用,一份看现有约束:
- ① CLI 指令执行现状 ——「实际被怎么用、在哪儿失败」。把 tuya-devplat-cli 上线至今 21,584 次真实调用全量摊开,258 个指令逐行列出调用 / 成功 / 失败次数和失败原因。整体成功 70.3%,真实失败约 1/5,暴露出高频高错命令、Agent 误调的不存在命令、参数错配等问题。
- ② 业务逻辑现状 ——「现在用什么管、哪些其实没管住」。把 128 条原始代码审计合并成 47 条 Agent 应遵守的业务规则,逐条标注每条当下靠什么保障:代码真拦 / 部分硬拦 / 提示词约束 / 无保障。标「无保障」的,正是改造最该补的缺口。