2026西湖龙井茶官网DTC发售:茶农直供,政府溯源防伪到农户家
阿里云基于开放遥测(OpenTelemetry)的可观测性插件为赫尔墨斯(Hermes)人工智能代理的执行提供了全面的可见性,实现了成本、性能和安全审计的可追溯性。
赫尔墨斯是由努斯研究(Nous Research)开发的一种自主人工智能代理运行时框架。它并非一次性问答对式的模型封装,而是一个能够持续运行、调用工具、积累经验并在使用过程中不断成长的代理运行时环境。
当人工智能代理真正开始解决问题时——无论其是否正确完成或表现出偏见——真正的挑战往往不在于结果是否正确,而在于它究竟做了什么。
赫尔墨斯的单次运行并非普通的模型调用。看似简单的交互可能涉及多轮推理、工具调用、结果重新注入、上下文扩展以及新的推理循环。模型决定下一步是否需要使用工具,而工具的结果反过来又会影响后续的推理路径。成本、延迟和故障往往发生在此过程的中间环节。
如果系统只能提供最终回复、零散的日志或单次调用的使用摘要,那么赫尔墨斯仍然是一个黑盒。你知道它完成了任务,但几乎无法得知它是如何完成的。你知道请求消耗了大量令牌(token),但几乎无法判断是哪个步骤推高了成本。你知道用户体验变慢了,但几乎无法确定是模型生成变慢、工具执行异常,还是推理与行动(ReAct)循环失控。
这正是我们将可观测性引入赫尔墨斯的出发点。
本文介绍了阿里云为赫尔墨斯提供的一套可观测性插件解决方案。它可以将赫尔墨斯的真实执行过程还原为结构化的调用链:会话从哪里开始,经过多少轮推理,调用了哪些工具,消耗了多少令牌,哪个步骤最耗时,故障发生在哪个边缘节点,哪些操作是恶意的,以及泄露了多少敏感数据。
如果你在实际工作中使用赫尔墨斯,你几乎肯定会遇到以下问题:
● 为什么这次这么贵?
● 为什么这次这么慢?
● 它真的调用了那个工具吗?
● 它使用的工具是否泄露了数据?
这些问题的共同点在于,它们关注的不是“结果”,而是“过程”。因此,如果我们只能看到最后的回复,那么从可观测性的角度来看,赫尔墨斯仍然是不可解释的。
我们究竟要解决什么问题
阿里云赫尔墨斯可观测性插件专注于解决以下四类问题。
首先是过程不可见。
在集成大语言模型后,许多系统仍然只显示用户输入、最终输出和使用摘要。但赫尔墨斯的实际运行远不止于此。在一次响应背后,可能有多轮推理、多次工具执行、持续的上下文扩展以及新的推理循环。如果没有调用链,中间过程本质上是一片空白。我们要做的第一件事就是填补这一空白。
其次是成本无法归因。
令牌账单本身并不是最难的
免责声明:本文内容来自互联网,该文观点不代表本站观点。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,请到页面底部单击反馈,一经查实,本站将立刻删除。
