v1.0.0
2026-04-19Voilà 正式首发。macOS 菜单栏语音输入,按住说话、松手粘贴,中英法日多语言混输。
核心功能
- 5 大 STT 引擎 — Soniox、ElevenLabs、Volcengine、Groq、Apple Speech。按场景和网络条件自由切换。
- 实时流式识别 — stop_to_text_ready 稳定 280-300ms,松手即出字。
- AI 润色 + 智能跳过 — 识别置信度 ≥ 0.9 时自动跳过润色,省 200-300ms 延迟和 LLM 成本。
- 终端智能粘贴 — Ghostty、iTerm2、Kitty 通过 Accessibility API 菜单粘贴,绕过 CGEvent 在繁忙渲染时丢键的问题。
- 词汇纠错 — 自定义术语映射,jieba 中文分词,filler word 过滤。
- 连接复用 — Soniox 支持 finalize 后保持连接 + keepalive,下次录音零冷启动。
- 蓝牙 HFP 处理 — 自动检测 A2DP 过渡态,等待 HFP 协商完成再录音。
- Sparkle 自动更新 — EdDSA 签名,新版本一键升级。
Build 2 优化
- 设备切换 debounce — CoreAudio 单次插拔会触发 4-7 次 callback,现在合并成 1 次处理,日志更干净。
- Pre-warm retry 加速 — 设备切换后的冷启动 retry 延迟 0.5s→0.2s,冷启动总耗时降低约 300ms。
- 设备切换提示重做 — 切换麦克风时显示蓝色 "信息" 标签,淡出不再闪烁 "正在聆听"。
- 日志噪音清理 — scheduleOverlayHide 的 retry=0 默认值不再打印,诊断时 grep 不再误判。
Build 3 修复
- Soniox 语言设置丢失修复 — 语言列表为空时未回退默认值(中文 + 英语),导致 Soniox 无法识别中英文混合输入。
系统要求
- macOS 14 Sonoma 或更高
- Apple Silicon(M1 及以上)
- 麦克风与辅助功能权限