很多人觉得 Claude 不够聪明，但其实90% 的错误不是模型不行，而是上下文

2026-05-20 14:57:27 玩转机器人是我科技

很多人觉得 Claude 不够聪明，但其实90% 的错误不是模型不行，而是上下文丢了。没有规则文件时，Claude 的错误率高达 41%；但只要严格遵循一套 12 条工程规则，错误率能直接压到 3%。

这说明，上下文工程（Context Engineering）才是真正的技术天花板。

12 条核心规则（建议全文背诵）

1. 思考先行

编码前强制陈述假设。

AI 不会读心，不要指望它自动理解你的潜台词。明确意图，是协作的起点。

2. 简约至上

追求最少代码，拒绝“预测性抽象”。

任何为了“未来灵活性”加的冗余，大概率会在下个季度被全部删除。

3. 精确修改

手术刀式触碰代码。

严禁 AI “顺便优化”相邻代码。这是防止 PR 规模失控、引入新 Bug 的关键。

4. 目标驱动

预先定义成功标准，并进行循环验证。

没有明确的终点，AI 要么死循环，要么在任务未完成时就宣布“搞定”。

5. 仅用于判断性任务

让模型负责分类、草拟、摘要、提取。

至于路由、重试、状态码处理等确定性逻辑，交给代码本身，别交给概率模型。

6. 严守 Token 预算

单次任务建议 4000 token，单次会话 30000 token。

对话一旦过长，AI 会开始反复建议你早已拒绝过的错误方案。

7. 暴露冲突，拒绝折中

代码库存在两种模式？选定一个。

AI 试图融合不同风格，只会导致错误被双重掩盖。保持一致性是第一优先级。

8. 先读后写

必须读取导出文件、调用方和共享工具。

否则，它会在已有功能旁边，再造一个一模一样的副本。

9. 测试验证意图，而非行为

如果业务逻辑变了，但测试依然通过，那测试就是失效的。

确保测试能捕捉逻辑的本质失效，而不是仅仅“跑通流程”。

10. 关键步骤设检查点

每完成一个重要阶段就确认。

别在错误的基础上继续构建，否则一小时后你才会发现底层架构早已崩塌。

11. 匹配代码库惯例

保持风格高度统一。

如果项目用 Class 组件，就别让 AI 偷偷引入 Hooks。这种隐性冲突会破坏整个测试体系。

12. 显性失败

最可怕的 Bug 是显示“成功”，却静默跳过数据。

要求 AI 暴露不确定性，严禁隐藏错误，让失败尽可能大声。

一句话总结：

别再怪模型蠢了。给足上下文、定死规则、守好边界，Claude 能从“猪队友”变成“结对编程大师”。