我们为何硬编码八个垂直领域预设，而非让生成式预训练变换模型自动生成幻灯片布局

大多数人工智能幻灯片工具让生成式预训练变换模型决定一切——布局、字体层级、章节结构。每次生成都是一次新的设计抽奖。我们采取了相反的方法：8 个硬编码的垂直领域预设，生成式预训练变换模型可以填充内容，但不能重新设计。

本文探讨为什么在我们的幻灯片生成流程中，约束胜过了创造力。

让大型语言模型设计布局的问题

早期原型：纯生成式预训练变换模型布局生成。模型决定：

结果：每套幻灯片看起来都各不相同。“各不相同”听起来不错，直到用户开始告诉我们：

第三个抱怨是致命的。当差异显而易见时，用户通常会认为“这个人工智能不知道自己在做什么”。

我们硬编码了 8 个针对特定垂直领域的预设：

每个预设都是一个确定性的布局系统。生成式预训练变换模型根据输入主题选择合适的预设，然后填充插槽内容。结构性差异随之消失。

我们考虑过显而易见的替代方案：5 个通用模板（“简洁”、“极简”、“活泼”）。它在用户测试中失败了，因为：

针对特定垂直领域的模板编码了领域假设：

这些假设随着垂直领域的选择自动生效——无需教导大型语言模型每种体裁期望什么。

我们失去了：

对于这两点，我们的回答是“当有明确需求时我们会添加预设”，而不是“让大型语言模型自行解决”。后者正是 v0 版本失败的原因。

每个预设只有一种“风格”——整个幻灯片集应用相同的布局系统。事后看来，风格应该在预设内根据幻灯片的位置（封面 vs 正文 vs 行动号召）而变化，而不仅仅是根据垂直领域。我们应该发布具有幻灯片集内部变化的“预设家族”，而不是将每个预设视为单一模板。

如果你想看看 8 个垂直领域预设架构在实际中是什么样子，AnySlide 已经发布了此架构的 v1 版本。免费开始使用（注册时赠送 60 积分，每日重置增加 10 积分，无需信用卡）。

我很想听听那些采取相反策略（完全依赖大型语言模型创造力）的人的意见——这是否得到了回报

免责声明：本文内容来自互联网，该文观点不代表本站观点。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，请到页面底部单击反馈，一经查实，本站将立刻删除。