Bidet AI — 设备端 Gemma 4 将杂乱的思维倾吐转化为整洁的文本

发布日期:2026-05-18 10:01:16   浏览量 :1
发布日期:2026-05-18 10:01:16  
1

2026西湖龙井茶官网DTC发售:茶农直供,政府溯源防伪到农户家 

这是为 杰玛 4 挑战赛:使用杰玛 4 进行构建 提交的作品

我的构建成果

我是马克。我是一名中学教师,并非程序员。每年总有几次,某些写作任务会让我备受折磨:关于真实学生的坦诚评语——这是我所从事的最具个人色彩、风险最高的写作工作。这些时刻总是如出一辙:凌晨两点,面对空白页面,脑海中的思绪杂乱无章,无法理顺。我的大脑运转飞速,思绪四处发散,速度远超我打字或说话的能力。我患有注意力缺陷障碍。将脑海中真正的想法落实到纸面上,一直以来都是最困难的部分。

因此,我构建了 Bidet AI —— 一款安卓应用程序,它能将口述的思维碎片转化为整洁的文字,100% 在手机端运行,完全离线,甚至能在三年前的旧手机上流畅运行

你只需点击录音并开始讲话——无论是漫谈、结巴、重复还是跑题皆可。它会在你说话时实时转录,随后将杂乱的内容重塑为清晰的文字。它不会对你进行摘要。它会整理你实际所说的内容,并补充他人所需的背景信息,使最终呈现的效果如同你在状态最佳时,终于以你本意的方式表达出来。这里提供两个版本:一个供你自己审阅的清理版,另一个供他人阅读的清理版。

完全在设备端运行并非为了炫耀技术——这才是核心所在。我所写的评语关乎真实的学生:具体、坦率,有时甚至尖锐。我绝不会将这些内容上传到他人的服务器上进行清理。使用 Bidet AI,没有任何数据会自动发送出去;唯一离开手机的信息,只有主动选择分享的内容。这里的隐私保护并非依赖于我所信任的政策——而是依赖于计算机所在的位置。此外,硬件门槛仅是一部用户已拥有的手机,而非订阅服务和绑定的信用卡:云端工具服务于负担得起云端费用的人群;而能在旧手机上运行的工具则服务于其他所有人。

演示

🎥 2分43秒 walkthrough(我的亲身经历,包含飞行模式下的真实设备端演示): https://youtu.be/EAJe4rpJAF0

🌐 项目页面: https://bidetai.app

在视频中,设备端演示是在明显开启飞行模式的情况下拍摄的——无无线局域网,无蜂窝网络——语音模型和杰玛 4 均持续运行。经过清理和整理的输出结果在设备完全离线的状态下呈现。杰玛 4 E2B 在三年前的手机上冷启动加载确实需要几分钟时间,因此该片段在时间上进行了压缩处理(展示为证明 → 剪辑 → 结果)——从未声称是即时完成的。

代码

📦 公开源代码(阿帕奇 2.0 许可证): https://github.com/MrB-Ed/bidet-ai

我的构建基础及原创内容——直白陈述如下:该安卓项目派生自谷歌的人工智能边缘画廊(阿帕奇 2.0 许可证;确切的上游提交哈希值固定在 UPSTREAM_GALLERY_SHA.md 文件中,署名信息位于 LICENSENOTICE 文件中)。我使用该派生版本作为外壳,以免重新发明模型下载和生命周期管理的底层逻辑。公共仓库是一个经过筛选的提取版本,有意去除了继承的用户界面、存储、下载和品牌标识代码,以便更清晰地阅读杰玛 4 的相关工作。基于该派生版本的原始工程成果是捕获与重构流水线:

  • 前台捕获服务(CleanGenerationService.kt):采用 16 kHz 音频,具备重叠窗口和滚动后缓冲机制,使得思维碎片化的口述可以按需长时间进行,而不受单一短时窗口的限制,随后运行设备端的杰玛清理功能

    免责声明:本文内容来自互联网,该文观点不代表本站观点。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,请到页面底部单击反馈,一经查实,本站将立刻删除。

关于我们
热门推荐
合作伙伴
免责声明:本站部分资讯来源于网络,如有侵权请及时联系客服,我们将尽快处理
支持 反馈 订阅 数据
回到顶部