2026西湖龙井茶官网DTC发售:茶农直供,政府溯源防伪到农户家
这是提交给赫尔墨斯智能体挑战赛的作品:使用赫尔墨斯智能体进行构建
我构建的内容
我构建了赫尔墨斯智能体与.klickd之间的原型集成,后者是一种用于人工智能智能体的开放可移植记忆格式。
我想探索的问题很简单:
每个新的智能体会话往往需要再次付出代价,去重新发现已经存在的上下文。
这种重复的上下文成本表现为:
- 重新解释项目状态;
- 重新加载约束条件;
- 重新发现之前的决策;
- 重新构建交接说明;
- 重新运行测试只是为了找到相同的失败;
- 失去对哪些操作需要人工批准的跟踪。
.klickd旨在将这种重复的上下文转化为一个可移植、加密、版本化的文件,智能体可以在工作开始前加载该文件。
赫尔墨斯智能体非常适合测试这一点,因为它是一个开源、自托管的智能体运行时,具备技能、插件、钩子、审批、本地执行和智能体工作流编排功能。
在这个项目中:
赫尔墨斯运行工作流。
.klickd承载状态。
该原型专注于一个名为上下文成本基准的基准测试,它比较两种模式:
基线冷启动
每次都将完整上下文粘贴到提示词中。.klickd加载模式
结构化上下文从.klickd固件中加载,并注入到智能体工作流中。
该基准测试旨在衡量:
- 重复输入的令牌数;
- 输出令牌数;
- 估算成本;
- 延迟;
- 连续性错误;
- 违反锁定决策的情况;
- 违反工具权限的情况;
- 交接质量;
- 不必要的昂贵命令重新运行。
目标并非声称有神奇的百分比改进。目标是可重复地衡量:
仅仅因为智能体必须重新发现我们已经产生的状态,我们为此支付了多少令牌和错误成本?
演示
为了参加赫尔墨斯智能体挑战赛,我在klickdskill仓库中创建了一个实验性的赫尔墨斯集成。
该演示使用赫尔墨斯智能体来驱动本地的.klickd上下文成本基准测试。
hermes_klickd_agent_session_messages_json
