弥合差距：Kubernetes 与分布式系统的未来方向

2026西湖龙井茶官网DTC发售：茶农直供，政府溯源防伪到农户家

弥合差距：Kubernetes 与分布式系统的未来方向

当《精灵宝可梦 GO》（Pokémon GO）发布时，全世界为之疯狂。在谷歌，我们目睹了我们的产品——Google Kubernetes Engine（谷歌 Kubernetes 引擎）——处理着此前仅存在于理论中的规模。这款游戏打破了消费者工作负载的所有纪录，成为 Kubernetes 和云原生编排领域的一个巨大成功案例。

我们构建了一个能够以无人想象过的规模管理无状态计算的系统。然而，当最初的兴奋消退后，与 Niantic 团队的对话揭示了一个隐藏的挑战。我们解决了应用程序编排的问题，但数据却是另一回事。

残酷的现实：Kubernetes 解决了计算问题，而非数据问题

这一经历凸显了一个至今仍然存在的根本性差距。Kubernetes 为有状态工作负载提供了原语，例如持久卷和有状态副本集，但它们本质上是以集群为中心的。它们将存储附加到 Pod 上，但并不理解数据本身。它们假设存储是本地且快速的，一旦你的工作负载需要跨越地理区域，这种假设就会崩溃。

我们为无状态应用程序提供了世界级的编排能力，但对于有状态、数据密集型的工作负载，我们很大程度上仍在手动拼凑各种组件。例如，你无法轻松编排一个在伦敦处理数据，然后将其移交给俄勒冈州模型训练任务的流水线。

多集群管理：必要但不完整的一步

行业解决此问题的初步尝试是多集群管理。Anthos、Rancher 和 OpenShift 等平台对于管理 Kubernetes 集群舰队至关重要。它们为跨不同环境的配置、策略和部署提供了统一的管理视图。这是迈向运维成熟度的关键一步。

但它并未解决数据问题。多集群管理有助于你驾驭集群，但并不能编排集群之间的数据。你可以使用它将 Spark 作业部署到 us-east-1 区域的集群，但如果你的数据位于 eu-west-2 区域，你仍然需要负责在作业开始之前，跨越大西洋移动那些数据的缓慢、昂贵且脆弱的过程。重心仍然是数据，而我们以计算为中心的工具被迫围绕它运转。

下一个前沿：从编排集群到编排数据

真正的分布式系统需要一种不同的方法。我们需要超越管理集群，开始直接编排工作负载，并将数据视为一等公民。这需要在技术栈中引入一个新的智能层，该层建立在基于共识的协议之上，能够跨集群边界做出决策。

这种方法允许系统：

将整个数据流水线理解为一个单一的逻辑单元，而不仅仅是分散在不同集群中的独立作业。
分析数据的位置、大小和依赖关系，以做出更智能的调度决策。
I
免责声明：本文内容来自互联网，该文观点不代表本站观点。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，请到页面底部单击反馈，一经查实，本站将立刻删除。