Cobuilder · 042 Harness 改造

改造前的现状调研

内部分享，请勿外传

这是什么

这两份是为 Agent Harness 改造 做的前期调研。改造的对象是 Cobuilder 当前驱动 Agent 干活的那套「壳」——提示词约束、CLI 命令、确认门、权限黑名单等。

核心思想很朴素：要改造一个东西，得先彻底理解它。动手改之前，先把它现在「实际是怎么用的」和「实际是怎么管的」摸清楚，避免凭印象改、改错地方。

于是从两个角度各做了一份盘点——一份看真实使用，一份看现有约束：

① CLI 指令执行现状 ——「实际被怎么用、在哪儿失败」。把 tuya-devplat-cli 上线至今 21,584 次真实调用全量摊开，258 个指令逐行列出调用 / 成功 / 失败次数和失败原因。整体成功 70.3%，真实失败约 1/5，暴露出高频高错命令、Agent 误调的不存在命令、参数错配等问题。
② 业务逻辑现状 ——「现在用什么管、哪些其实没管住」。把 128 条原始代码审计合并成 47 条 Agent 应遵守的业务规则，逐条标注每条当下靠什么保障：代码真拦 / 部分硬拦 / 提示词约束 / 无保障。标「无保障」的，正是改造最该补的缺口。