我们为何硬编码八个垂直领域预设,而非让生成式预训练变换模型自动生成幻灯片布局

发布日期:2026-05-16 10:34:00   浏览量 :0
发布日期:2026-05-16 10:34:00  
0

2026西湖龙井茶官网DTC发售:茶农直供,政府溯源防伪到农户家 

大多数人工智能幻灯片工具让生成式预训练变换模型决定一切——布局、字体层级、章节结构。每次生成都是一次新的设计抽奖。我们采取了相反的方法:8 个硬编码的垂直领域预设,生成式预训练变换模型可以填充内容,但不能重新设计。

本文探讨为什么在我们的幻灯片生成流程中,约束胜过了创造力。

让大型语言模型设计布局的问题

早期原型:纯生成式预训练变换模型布局生成。模型决定:

  • 每张幻灯片的章节数量
  • 标题与副标题的层级关系
  • 项目符号与段落结构
  • 颜色强调
  • 素材放置

结果:每套幻灯片看起来都各不相同。“各不相同”听起来不错,直到用户开始告诉我们:

  • “为什么第二张幻灯片是五点列表,而第三张是三点项目符号层级?”
  • “第七张幻灯片的字体巨大,但第八张却很小。”
  • “看起来像是人工智能生成的。”

第三个抱怨是致命的。当差异显而易见时,用户通常会认为“这个人工智能不知道自己在做什么”。

解决方案:预先选择布局,仅让大型语言模型填充内容

我们硬编码了 8 个针对特定垂直领域的预设:

  • 职业:痛点 → 框架 → 行动章节的层级结构
  • 金融:以图表为主,辅以项目符号说明
  • 阅读:书籍封面 + 章节引言 + 三点收获模板
  • 美容:以图片为主导,配有叠加字幕
  • 健康:数据优先,附带引用脚注
  • 文化:时间轴风格,配以强调性图像
  • 旅行:地图 + 照片网格 + 行程分解
  • 知识:三栏对比 + “关键洞察”重点标注

每个预设都是一个确定性的布局系统。生成式预训练变换模型根据输入主题选择合适的预设,然后填充插槽内容。结构性差异随之消失。

为什么首选垂直领域,而非通用领域

我们考虑过显而易见的替代方案:5 个通用模板(“简洁”、“极简”、“活泼”)。它在用户测试中失败了,因为:

  • “简洁”并不能告诉你内容应该放在哪里
  • 同样的“极简”模板应用于金融幻灯片和旅行幻灯片时,看起来都很平庸

针对特定垂直领域的模板编码了领域假设:

  • 金融幻灯片的第一页应该是图表
  • 阅读幻灯片的第一页应该是书籍封面
  • 旅行幻灯片的最后一页应该是地图

这些假设随着垂直领域的选择自动生效——无需教导大型语言模型每种体裁期望什么。

我们失去的东西

我们失去了:

  • 针对我们未预见到的垂直领域(商业路演、科学论文等)的灵活性
  • 在幻灯片集中间尝试新颖布局的能力

对于这两点,我们的回答是“当有明确需求时我们会添加预设”,而不是“让大型语言模型自行解决”。后者正是 v0 版本失败的原因。

我会不同的做法

每个预设只有一种“风格”——整个幻灯片集应用相同的布局系统。事后看来,风格应该在预设内根据幻灯片的位置(封面 vs 正文 vs 行动号召)而变化,而不仅仅是根据垂直领域。我们应该发布具有幻灯片集内部变化的“预设家族”,而不是将每个预设视为单一模板。

试一试

如果你想看看 8 个垂直领域预设架构在实际中是什么样子,AnySlide 已经发布了此架构的 v1 版本。免费开始使用(注册时赠送 60 积分,每日重置增加 10 积分,无需信用卡)。

我很想听听那些采取相反策略(完全依赖大型语言模型创造力)的人的意见——这是否得到了回报

免责声明:本文内容来自互联网,该文观点不代表本站观点。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,请到页面底部单击反馈,一经查实,本站将立刻删除。

关于我们
热门推荐
合作伙伴
免责声明:本站部分资讯来源于网络,如有侵权请及时联系客服,我们将尽快处理
支持 反馈 订阅 数据
回到顶部