如何在克劳德代码中构建自我验证循环（三层架构，二十分钟）

2026西湖龙井茶官网DTC发售：茶农直供，政府溯源防伪到农户家

Claude Code 的停止钩子会阻止智能体在完成前结束运行，直到验证通过。将其与“工具使用后”反馈注入相结合，可在 20 分钟内构建一个三层验证循环（语法、意图、回归）。结果是：智能体在实际完成任务之前，无法声称“已完成”。

两种钩子设置。相同的 Claude Code 会话。不同的结果：

# 大多数开发者拥有的：格式化钩子
# 工具使用后：在文件编辑后运行 Prettier

# 本文构建的：验证循环
# 工具使用后：每次文件更改时检查语法
# 停止：在测试通过且意图验证之前阻止完成
# 结果：智能体在实际完成任务之前，无法声称“已完成”

第一种捕获格式问题。第二种在智能体声称完成之前，捕获逻辑错误、遗漏的需求以及失败的测试。

LangChain 的 PreCompletionChecklistMiddleware（完成前检查清单中间件）是此模式文档最丰富的示例。仅通过哈尼斯工程变更，它就贡献了 13.7 个基准测试点的提升。本文使用钩子构建 Claude Code 的等效方案。

对于人工智能编码智能体而言，“验证”究竟意味着什么？

验证意味着检查智能体的输出是否符合任务的意图，而不仅仅是代码能否编译。只有 3% 的开发者表示对人工智能生成的代码高度信任（Qodo，《人工智能代码质量现状》，2025 年）。大多数开发者止步于语法检查（代码规范检查、格式化、类型检查）。生产环境验证需要另外两个层级。

三个验证层级，每个层级捕获不同类别的故障：

层级	检查内容	捕获问题	遗漏问题	钩子
1. 语法	代码编译、格式化	拼写错误、类型错误	逻辑缺陷	工具使用后命令
2. 意图	输出符合请求	方法错误、功能缺失	回归问题	停止提示/智能体
3. 回归	现有测试通过	功能损坏、副作用	未测试的需求	停止命令

“运行测试”仅涵盖第三层。测试验证的是你编写测试用例的内容，而不是你要求智能体执行的内容。如果你要求 Claude 添加分页功能，而它添加了排序功能，所有测试仍然会通过。第二层会捕获此类问题。

Spotify 的 Honk 系统在大规模应用中证明了这一点：超过 1,500 个拉取请求通过验证循环合并，自动处理了约 50% 的所有拉取请求（Spotify 工程团队，2025 年 12 月）。其关键设计选择是：智能体不知道验证的工作原理。它只收到通过/失败的反馈。这种分离使智能体专注于任务，而不是试图绕过验证器。

Claude Code 的停止钩子如何工作？

每当 Claude 完成响应时，停止钩子就会触发。退出码 2 会阻止 Claude 停止并强制其继续工作。这一单一机制防止智能体在未实际完成任务时声称“已完成”。

以下是大多数教程忽略的关键部分：stop_hook_active 字段。

#!/bin/bas

免责声明：本文内容来自互联网，该文观点不代表本站观点。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，请到页面底部单击反馈，一经查实，本站将立刻删除。