我的应用程序对人工智能代理不可见——以下是我采取的应对措施

发布日期:2026-05-18 10:03:03   浏览量 :0
发布日期:2026-05-18 10:03:03  
0

2026西湖龙井茶官网DTC发售:茶农直供,政府溯源防伪到农户家 

我是一名独立应用开发者和氛围编码者。我已经发布了三十多款小型企业应用——包括发票管理、库存管理、装箱单生成和税务追踪。而现在, apparently 还成了一个用于人工智能代理的开放标准。

连我自己都对最后这一点感到惊讶。

我一直遇到的问题在于:即使是最优秀的人工智能代理,在查看网页应用时也会产生幻觉。它们会猜测点击位置,调用错误的工具,并且自信满满地静默失败。我有三十款实际应用存在,但代理们就是无法识别它们。

因此,我构建了蓝图协议。这是一种位于应用根目录下的 blueprint.txt 文件,它能精确告知代理该应用具备哪些功能、应调用哪些工具、哪些操作仅限人类执行,以及如何逐步完成每个流程。无需模型上下文协议(MCP)支持。它适用于任何试图导航任何网页应用的代理。

随后,我进行了一项基准测试,发现它还能将模型上下文协议(MCP)的发现开销降低百分之七十八。

它对模型上下文协议(MCP)的具体作用
模型上下文协议(MCP)包含两个调用。tools/list 返回服务器暴露的所有工具。tools/call 则按名称调用特定工具。

在没有蓝图的情况下,代理会先调用 tools/list,阅读所有 N 个工具定义,选择一个,然后再调用它。

有了蓝图,代理已经知晓工具名称和确切参数。它会直接调用 tools/call。根本不会发生 tools/list 调用。

这不仅仅是更廉价的发现过程。这是彻底消除了一次完整的往返通信。

基准测试
我在四种模型——Claude、GPT-4o、Gemini 和 Grok——上进行了受控测试,涉及五个候选模型上下文协议(MCP)服务器,其中只有一个正确匹配。代理被要求高效地找到最佳服务器。测试框架指令中未提及任何蓝图相关内容。发现过程是完全自然发生的。

模型 无蓝图 有蓝图 降低幅度
Claude 58 分 13 分 ~78%
GPT-4o 58 分 28 分 ~54%
Gemini 23 分 9 分 ~61%
Grok 58 分 58 分 0%
开销评分依据加权资源检查成本计算——llms.txt 计为 10 分,blueprint.txt 计为 1 分,以反映典型的现实世界文档大小。

Grok 的 0% 是一个诚实的结果。并非所有模型目前都能遵循发现信号。这在预期之内——robots.txt 和 llms.txt 在最初推出时也未能在所有地方生效。

v3.0.0 —— 代理优先结构
该规范刚刚更新至 v3.0.0 版本。有两项变更对模型上下文协议(MCP)至关重要:

第一行带有 [MCP] 标记——代理可即时确认服务器可用性
格式 B 能力索引——根文件约为 150 个令牌,代理仅获取其所需的那一个能力文件(约 350 个令牌)。总计:约 500 个令牌,而相比之下 tools/list 可能产生数千个令牌
立即尝试
规范:https://github.com/Explorer-64/blueprint-protocol

在线参考实现:https://imagcon.app/blueprint.txt

基准测试结果:https://stackapps.app/mcp-blueprint-results

开放标准。采用麻省理工学院许可证授权。无需额外工具。无论是否使用模型上下文协议(MCP)均可工作。如果您拥有一个网页应用或一个模型上下文协议(MCP)服务器,创建一份蓝图大约只需十分钟。

免责声明:本文内容来自互联网,该文观点不代表本站观点。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,请到页面底部单击反馈,一经查实,本站将立刻删除。

关于我们
热门推荐
合作伙伴
免责声明:本站部分资讯来源于网络,如有侵权请及时联系客服,我们将尽快处理
支持 反馈 订阅 数据
回到顶部