《信息周刊》称：通过流程控制人工智能代理成本。但这种方法为何无法规模化？

2026西湖龙井茶官网DTC发售：茶农直供，政府溯源防伪到农户家

《信息周刊》最近发布了《在失控前控制人工智能代理成本的实用指南》——这是一份关于管理人工智能代理支出的九项建议的扎实综述。这些建议合情合理：按工作流追踪成本；对低风险任务使用更便宜的模型；设置令牌配额；尽可能缓存结果。

如果你只运行少量执行明确定义任务的代理，这些指导完全足够。但问题在于，没有人会长期停留在“少量代理、明确定义任务”的阶段。

当单个代理为处理一个提示就发起1500次API调用，而你又有200个代理全天候不间断地在十几个业务部门中运行时，组织流程根本无法跟上节奏。电子表格审核、季度审计和人工设置配额，这些机制并非为以机器速度做出经济决策的系统而设计。《信息周刊》的建议说明了要做什么，但缺失的是如何做——具体而言，是如何在无需人工介入的情况下落实这些控制措施。

规模化问题已然到来

这并非假设。相关数据已经触目惊心。

高德纳公司预测，到2027年，超过40%的人工智能代理项目将因成本失控而失败——失败原因并非技术缺陷，也非模型质量低下，而是支出完全失控。去年，《财富》500强企业合计产生了约4亿美元未纳入预算的人工智能支出，其中很大一部分来自无人以足够细粒度进行追踪的代理工作负载。

曾有一起广为人知的事件：一个代理循环在11天内悄然累积了4.7万美元费用，却无人察觉。该代理运行完全正常——它只是忠实地执行了指令，并持续不断地执行下去，没有任何机制阻止其继续花钱。

现有流程未能发现上述任何问题，并非因为流程本身有缺陷，而是因为代理的运行速度远超人类审查能力。

九项建议与基础设施的对应关系

让我们认真对待《信息周刊》提出的九项建议，并逐一追问：每一项究竟是依赖持续的人工流程，还是可以在基础设施层实现自动化？

第1条：选择灵活的平台

这是很好的建议。应选择支持模型切换、配置调整且避免厂商锁定的平台。但这属于一次性架构决策，而非持续性的控制措施。该决策应在采购阶段完成，而非运营阶段实施。它不需要强制执行，而需要优秀的工程领导力。

第2条：对低风险任务使用低成本大语言模型

这本质上是模型路由——将简单查询导向廉价模型，仅在复杂推理时调用昂贵模型。这一思路完全正确。但如果由人工逐个工作流、逐个团队地手动操作，其工作量将随代理规模线性增长，成为一项全职任务。

在基础设施层面，这可转化为基于工具的成本归因与模型路由策略。网关能识别每个工具的成本，据此自动路由，并在无需人工审核电子表格的情况下强制执行策略。决策只需编码一次，执行则持续不断。

第3条：利用大语言模型预测工作流成本

《信息周刊》建议用一个大语言模型来预测另一个模型的成本。这种做法颇具巧思，但属于预测性方法——你获得一个估算值，然后寄希望于实际成本与之相符。

在基础设施层面，更优方案是执行前预算强制检查。不要事后预测成本，而应在每次调用之前检查预算。若预算已耗尽，则拒绝执行该调用。无需预测，

免责声明：本文内容来自互联网，该文观点不代表本站观点。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，请到页面底部单击反馈，一经查实，本站将立刻删除。