《信息周刊》称:通过流程控制人工智能代理成本。但这种方法为何无法规模化?

发布日期:2026-03-29 10:05:29   浏览量 :0
发布日期:2026-03-29 10:05:29  
0

2026西湖龙井茶官网DTC发售:茶农直供,政府溯源防伪到农户家 

《信息周刊》最近发布了《在失控前控制人工智能代理成本的实用指南》——这是一份关于管理人工智能代理支出的九项建议的扎实综述。这些建议合情合理:按工作流追踪成本;对低风险任务使用更便宜的模型;设置令牌配额;尽可能缓存结果。

如果你只运行少量执行明确定义任务的代理,这些指导完全足够。但问题在于,没有人会长期停留在“少量代理、明确定义任务”的阶段。

当单个代理为处理一个提示就发起1500次API调用,而你又有200个代理全天候不间断地在十几个业务部门中运行时,组织流程根本无法跟上节奏。电子表格审核、季度审计和人工设置配额,这些机制并非为以机器速度做出经济决策的系统而设计。《信息周刊》的建议说明了要做什么,但缺失的是如何做——具体而言,是如何在无需人工介入的情况下落实这些控制措施。

规模化问题已然到来

这并非假设。相关数据已经触目惊心。

高德纳公司预测,到2027年,超过40%的人工智能代理项目将因成本失控而失败——失败原因并非技术缺陷,也非模型质量低下,而是支出完全失控。去年,《财富》500强企业合计产生了约4亿美元未纳入预算的人工智能支出,其中很大一部分来自无人以足够细粒度进行追踪的代理工作负载。

曾有一起广为人知的事件:一个代理循环在11天内悄然累积了4.7万美元费用,却无人察觉。该代理运行完全正常——它只是忠实地执行了指令,并持续不断地执行下去,没有任何机制阻止其继续花钱。

现有流程未能发现上述任何问题,并非因为流程本身有缺陷,而是因为代理的运行速度远超人类审查能力。

九项建议与基础设施的对应关系

让我们认真对待《信息周刊》提出的九项建议,并逐一追问:每一项究竟是依赖持续的人工流程,还是可以在基础设施层实现自动化?

第1条:选择灵活的平台

这是很好的建议。应选择支持模型切换、配置调整且避免厂商锁定的平台。但这属于一次性架构决策,而非持续性的控制措施。该决策应在采购阶段完成,而非运营阶段实施。它不需要强制执行,而需要优秀的工程领导力。

第2条:对低风险任务使用低成本大语言模型

这本质上是模型路由——将简单查询导向廉价模型,仅在复杂推理时调用昂贵模型。这一思路完全正确。但如果由人工逐个工作流、逐个团队地手动操作,其工作量将随代理规模线性增长,成为一项全职任务。

在基础设施层面,这可转化为基于工具的成本归因与模型路由策略。网关能识别每个工具的成本,据此自动路由,并在无需人工审核电子表格的情况下强制执行策略。决策只需编码一次,执行则持续不断。

第3条:利用大语言模型预测工作流成本

《信息周刊》建议用一个大语言模型来预测另一个模型的成本。这种做法颇具巧思,但属于预测性方法——你获得一个估算值,然后寄希望于实际成本与之相符。

在基础设施层面,更优方案是执行前预算强制检查。不要事后预测成本,而应在每次调用之前检查预算。若预算已耗尽,则拒绝执行该调用。无需预测,

免责声明:本文内容来自互联网,该文观点不代表本站观点。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,请到页面底部单击反馈,一经查实,本站将立刻删除。

关于我们
热门推荐
合作伙伴
免责声明:本站部分资讯来源于网络,如有侵权请及时联系客服,我们将尽快处理
支持 反馈 订阅 数据
回到顶部