显微镜下的赫尔墨斯：全面洞察智能体执行过程

2026西湖龙井茶官网DTC发售：茶农直供，政府溯源防伪到农户家

阿里云基于开放遥测（OpenTelemetry）的可观测性插件为赫尔墨斯（Hermes）人工智能代理的执行提供了全面的可见性，实现了成本、性能和安全审计的可追溯性。

赫尔墨斯是由努斯研究（Nous Research）开发的一种自主人工智能代理运行时框架。它并非一次性问答对式的模型封装，而是一个能够持续运行、调用工具、积累经验并在使用过程中不断成长的代理运行时环境。

当人工智能代理真正开始解决问题时——无论其是否正确完成或表现出偏见——真正的挑战往往不在于结果是否正确，而在于它究竟做了什么。

赫尔墨斯的单次运行并非普通的模型调用。看似简单的交互可能涉及多轮推理、工具调用、结果重新注入、上下文扩展以及新的推理循环。模型决定下一步是否需要使用工具，而工具的结果反过来又会影响后续的推理路径。成本、延迟和故障往往发生在此过程的中间环节。

如果系统只能提供最终回复、零散的日志或单次调用的使用摘要，那么赫尔墨斯仍然是一个黑盒。你知道它完成了任务，但几乎无法得知它是如何完成的。你知道请求消耗了大量令牌（token），但几乎无法判断是哪个步骤推高了成本。你知道用户体验变慢了，但几乎无法确定是模型生成变慢、工具执行异常，还是推理与行动（ReAct）循环失控。

这正是我们将可观测性引入赫尔墨斯的出发点。

本文介绍了阿里云为赫尔墨斯提供的一套可观测性插件解决方案。它可以将赫尔墨斯的真实执行过程还原为结构化的调用链：会话从哪里开始，经过多少轮推理，调用了哪些工具，消耗了多少令牌，哪个步骤最耗时，故障发生在哪个边缘节点，哪些操作是恶意的，以及泄露了多少敏感数据。

如果你在实际工作中使用赫尔墨斯，你几乎肯定会遇到以下问题：

● 为什么这次这么贵？

● 为什么这次这么慢？

● 它真的调用了那个工具吗？

● 它使用的工具是否泄露了数据？

这些问题的共同点在于，它们关注的不是“结果”，而是“过程”。因此，如果我们只能看到最后的回复，那么从可观测性的角度来看，赫尔墨斯仍然是不可解释的。

我们究竟要解决什么问题
阿里云赫尔墨斯可观测性插件专注于解决以下四类问题。

首先是过程不可见。

在集成大语言模型后，许多系统仍然只显示用户输入、最终输出和使用摘要。但赫尔墨斯的实际运行远不止于此。在一次响应背后，可能有多轮推理、多次工具执行、持续的上下文扩展以及新的推理循环。如果没有调用链，中间过程本质上是一片空白。我们要做的第一件事就是填补这一空白。

其次是成本无法归因。

令牌账单本身并不是最难的

免责声明：本文内容来自互联网，该文观点不代表本站观点。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，请到页面底部单击反馈，一经查实，本站将立刻删除。