受 Wispr Flow 启发,我做了一个 macOS 上的 AI 语音输入法:秒言
大家好,最近受 Wispr Flow 的启发,我自己做了一个 macOS 上的 AI 语音输入法,名字叫 秒言,目前只支持 macOS 。
我自己是高频输入用户,日常在写代码注释、产品文档、长文本时,越来越不想打字。但实际用下来,大多数语音输入工具都有一个共同问题:
识别完还得改,而改字的成本并不低。
我做这个产品的目标只有一个:
在中文环境下,尽量做到「说完就能直接用」,而不是「说完再编辑」。
为什么不做本地 ASR
这是被问得最多的一个问题。
不做本地识别,原因其实很直接:
-
目前本地 ASR 在中文准确率上仍然存在明显短板
-
实际体验往往是:每次输入后都需要修正几个字
-
对我来说,这已经破坏了语音输入本该带来的效率提升
因此,秒言采用的是 云端 ASR + 强后处理 的方案,目标不是“能用”,而是:
尽量少改,甚至不改。
目前秒言主要做了哪些事
简单概括当前阶段的侧重点:
-
中文识别速度与准确率优先
-
针对真实输入场景做了大量后处理
-
中英文混输
-
口语表达修正
-
-
尽量减少打断式 UI ,输入完成后直接回填到当前输入框
在我自己的日常使用中,大多数场景已经可以做到 0 编辑或极少编辑。
适合哪些人 / 不适合哪些人
比较适合:
-
macOS 用户
-
写文档、写说明、写长文本
-
已经对「传统语音输入需要频繁修改」感到厌烦的人
可能不太适合:
-
强依赖完全离线使用的场景
-
对云端方案完全无法接受的用户
给开发者的小彩蛋
对开发人员额外做了一些偏“效率工具”的能力:
-
在 Shell 终端中
可以直接说出你想执行的命令
-
例如:
“查看当前系统磁盘占用情况”
会直接输出:
-
df -h
-
在编辑器中
需要写正则时可以直接描述意图
-
例如:
“帮我写一个正则,查找所有电话号码”
-
产品地址
目前还在持续迭代阶段,欢迎直接试用。
如果你也在 macOS 上大量输入中文,或者对语音输入体验有更高要求,非常欢迎试一试。任何真实反馈,对我来说都很有价值。