亚马逊因AI生成代码引发多次宕机

发布日期:2026-03-19 10:03:36   作者 :小助    浏览量 :2
小助 发布日期:2026-03-19 10:03:36  
2

亚马逊高级副总裁致信工程师,称网站可用性近期表现不佳,并指出人工智能辅助的代码变更是一个促成因素。新政策规定:初级和中级工程师在部署人工智能生成的代码前,必须获得高级工程师的批准。这家全球最先进的人工智能基础设施公司刚刚重新引入了人为干预——并非因为人工智能不可靠,而是因为基础设施故障的影响范围具有系统性。

亚马逊零售技术高级副总裁戴夫·特雷德韦尔周一致信其工程团队,表示“网站及相关基础设施的可用性近期表现不佳。”随后他宣布了政策调整:初级和中级工程师今后在将任何人工智能生成的代码部署到生产环境之前,必须获得高级工程师的批准。

这家全球最先进的人工智能基础设施公司刚刚为人工智能生成的代码增设了一道人工审核关卡。这不是临时措施,而是制度性政策。

模式

直接导火索是3月5日发生的一次长达六小时的宕机事件,导致亚马逊零售网站完全离线。用户无法完成结账、无法查看商品价格、也无法访问自己的账户。两小时内,Downdetector平台收到了超过两万两千份故障报告。亚马逊将此次事件归因于一次“软件代码部署”。宕机还波及移动应用程序、Amazon Fresh、全食超市(Whole Foods)以及卖家中心(Seller Central)。大约六个小时内,这家全球最大的在线零售商无法销售任何商品。

但特雷德韦尔的邮件揭示了更深层的问题。他指出,自2025年第三季度以来,已出现一系列与“生成式人工智能辅助变更”相关的“高影响范围事件”。在政策调整前,这类故障已累积了六个月之久。邮件中提到,“生成式人工智能工具正在补充或加速生产环境中的变更指令,从而导致不安全的操作实践。”特雷德韦尔承认,针对这些工具的“最佳实践和安全防护措施尚未完全建立。”

此次零售业务宕机并非首起事件,而是最终迫使公司采取制度性应对措施的那一次。此前,亚马逊云服务(AWS)自身也已遭遇过与人工智能相关的中断——至少有两次宕机与人工智能编码工具相关,其中一次是一名智能代理被允许在无人干预的情况下执行变更,而它判定的“正确操作”竟是删除并重建一个面向客户的核心系统。由此引发的宕机持续了十三个小时。亚马逊将其归咎于“用户操作失误”,而目睹事件全过程的员工则称之为“完全可以预见的后果”。

变量

在特雷德韦尔发出邮件的十二天前,Block公司裁减了40%的员工——超过四千人——并明确将原因归于“智能工具”的应用。消息公布后,该公司股价在盘后交易中飙升24%。首席财务官表示,公司看到了“通过规模更小、能力更强的团队,利用人工智能自动化更多工作,从而加快前进速度的机会。”首席执行官则预测,大多数公司将在一年内跟进类似做法。

两家公司,对人工智能辅助工作中是否需要人工介入作出了截然相反的决策。但两者都得到了各自受众的认可——投资者为Block的裁员举措鼓掌,而亚马逊的工程管理层则将新增的审批关卡视为运营必需,而非战略退缩。

解释这两种决策背后的关键变量,正是“影响范围”(blast radius)。

Block公司的人工智能编写的是功能代码——Cash App的用户界面、Square的支付流程、商户工具等。当某个功能出错时,仅该功能受影响。错误的影响范围是有限的:用户发现一个漏洞,团队修复该漏洞,服务继续运行。任何单个人工智能生成代码变更的影响范围都是局部的,其贡献也是个体化的。在这种场景下,移除个体贡献环节中的人工审核关卡,可以提升开发速度,而不会增加系统性风险。

而亚马逊的人工智能编写的是基础设施代码——那些维系全球运转的系统

免责声明:本文内容来自互联网,该文观点不代表本站观点。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,请到页面底部单击反馈,一经查实,本站将立刻删除。

关于我们
热门推荐
合作伙伴
免责声明:本站部分资讯来源于网络,如有侵权请及时联系客服,我们将尽快处理
支持 反馈 订阅 数据
回到顶部