安蒂雷兹发布 DS4:在 128 GB 内存的 Mac 上本地运行深度求索 v4 闪速版

发布日期:2026-05-15 10:33:11   浏览量 :2
发布日期:2026-05-15 10:33:11  
2

2026西湖龙井茶官网DTC发售:茶农直供,政府溯源防伪到农户家 

萨尔瓦托雷·桑菲利波(Salvatore Sanfilippo),在生态系统中以 antirez 之名闻名,也是 Redis 的创造者,本周发布了一个已经在本地人工智能社区引起震动的:DwarfStar 4,或简称 DS4 antirez。据他透露,该项目是在一周的高强度工作(每天十四小时)中构建完成的,DS4 是一款专注于在高端消费级硬件上运行 DeepSeek v4 Flash 的本地推理工具。

这一举措影响重大:多年来尝试本地模型后,antirez 首次表示,他正在使用其中一个模型来处理以前委托给 Claude 或 GPT 的严肃任务。鉴于他是 Redis 的作者,这一点值得密切关注。

内容摘要

  • DS4 是 antirez 在一周高强度工作(每天14小时)中创建的本地推理工具。
  • 它专门用于运行采用 2/8 位非对称量化的 DeepSeek v4 Flash。
  • 需要 96 或 128 GB 统一内存:非常适合 Mac M3/M4 Max 或 DGX Spark 类型的设备。
  • 这是 antirez 首次使用本地模型处理通常委托给 Claude 或 GPT 的严肃工作。
  • 利用向量引导技术,实现更自由、人工限制更少的对话体验。
  • 发展路线图包括专用变体:ds4-coding(编程)、ds4-legal(法律)和 ds4-medical(医疗),可按需加载。
  • 下一步计划:质量基准测试、集成编程代理、配备专用硬件的持续集成以及串行和并行分布式推理。

什么是 DS4 以及为何它在一周内走红

DS4(DwarfStar 4)是一个发布在 github.com/antirez/ds4 上的开源项目,它在2026年押注一个看似反直觉的理念:专注于单一模型,而不是成为像 llama.cpp 或 Ollama 那样的通用包装器。antirez 的假设很直接:本地人工智能的瓶颈并非推理引擎,而是缺乏足够接近前沿水平、能够替代对 Claude 或 GPT 实际查询的开放模型。

当 DeepSeek 发布 v4 Flash 时,这块拼图终于契合。近乎前沿的模型与 2/8 位非对称量化方案的结合,使得在 Mac 上运行严肃的人工智能应用不再只是一个新奇的实验,而成为一种可操作的选择。DS4 围绕这一赌注构建,并不追求通用性。

这一周工作的成果是一个在几天内就在 GitHub 上积累了数千颗星,并在 Hacker News、Reddit 和 X 平台上引发讨论的代码库。其受欢迎程度甚至让 antirez 本人感到惊讶,他在总结文章中承认,自己未料到反应如此迅速。他用一句话结束了这篇文章——“人工智能至关重要,不能仅仅作为第三方提供的服务”——这概括了该项目的深层动机。

DS4 完全在本地运行,不依赖外部应用程序接口。

押注 DeepSeek v4 Flash

选择 DeepSeek v4 Flash 并非偶然。直到几个月前,优质本地模型的体验——我们称之为体验 A——与云端前沿模型的体验——体验 B——之间还存在着巨大的鸿沟:前者仅供玩赏,后者才用于严肃工作。据 antirez 称,DS4 “更接近 B 而非 A”。这句话总结了这种质的变化。

DeepSeek v4 Flash 是一个混合专家模型,在混合量化方面表现异常出色。该模型背后的中国公司一直保持着稳定的发布节奏

免责声明:本文内容来自互联网,该文观点不代表本站观点。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,请到页面底部单击反馈,一经查实,本站将立刻删除。

关于我们
热门推荐
合作伙伴
免责声明:本站部分资讯来源于网络,如有侵权请及时联系客服,我们将尽快处理
支持 反馈 订阅 数据
回到顶部