V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
oldcai
0.01D

[免费] [Windows 版来了] LazyTyper:语音 7x 倍速怒喷 AI

  •  6
     
  •   oldcai ·
    PRO
    ·
    oldcai · 2025 年 8 月 23 日 · 17161 次点击
  •   指定的图片不存在
    这是一个创建于 245 天前的主题,其中的信息可能已经有所发展或是发生改变。

    ✨永久免费的LazyTyper 语音输入法Windows 版上线

    上周我在 V2EX 发了 Mac 版 的 LazyTyper。很多朋友留言让我也支持 Windows ,这周我把它做出来了。

    它解决了什么?

    自从买了 Claude Code 的 Max 套餐,我最大瓶颈不是 token 不够,而是输入太慢。看到别人一天能吃$1000+的自助餐眼馋坏了,那就用魔法打败魔法吧!

    我试遍了市面上的语音输入:要么贵、要么卡、要么不准。

    于是给自己写了一个按住说话、松开放字的小工具,越用越离不开——天天给 Claude Code / ChatGPT 口述复杂 prompt ,我觉得我退化了的嘴巴又长回来了,甚至敢和家里的领导讲讲道理了……虽然再次惜败😅

    体感 3–7× 更快,我已经很少长篇键盘输入了。

    主要特性

    • 语音写代码:按住全局快捷键说话,松开即把文字插入到光标处( VS Code / JetBrains / Rider / PyCharm / 终端 / 浏览器等任意输入框)

    • 自动标点 & 多语言:自然说就行,自动出标点,适合中英文混说

    • 5 个识别引擎可选(可随时切换):

      • 豆包语音
      • 🆕 ElevenLabs
      • Groq ( Whisper )
      • Mistral ( Voxtral )
      • AssemblyAI
    • AI 好搭子:一键把语音转成长 prompt ,连续补充思路不打断

    快速开始

    1. 下载并安装
    2. 选择一个(或多个)识别引擎与语言(填入对应 API Key,5 选一即可)
    3. 快捷键默认 Ctrl+Space ,可更改 → 在任意输入框 按住说话、松开出字

    请大家帮我多提意见!

    讲讲你的

    • 快捷键习惯,是否冲突(默认的如果不合适,我可以改改)

    • 5 家引擎在你场景下哪个更好用,比如哪个最准,哪个最快?(我 Vibe Coding 的时候 ElevenLabs 最强)

    • 这些功能对你来说是贴心还是多余?

      • 自定义词汇表
      • 重新识别(纠错)
      • 中文智能标点替换,移除「呃」、「嗯」
      • 本地保存、搜索历史记录
      • 录音时静音
      • 保持麦克风活跃(加快启动速度)

    欢迎提建议,我会逐条跟进完善。

    好用的话,也不要害羞,来夸夸我~

    官网下载:https://lazytyper.com/zh

    第 1 条附言  ·  2025 年 11 月 21 日
    现在这个版本已经支持了 12 个模型,包括 5 个本地模型。本地模型的运行速度挺快的,准确率也在线

    另外,还支持了通义千问 qwen3-ASR, 准确性我觉得是中英文混合识别中第一名。非常适合 Vibe Coding
    Solana
    V2EX 支持通过 Solana 网络向内容作者打赏
    Parvasillydaddy 一共打赏了 70 $V2EX
    109 条回复    2026-01-04 00:15:28 +08:00
    1  2  
    demen
        101
    demen  
       2025 年 11 月 26 日
    我的重大决策紧急按钮终于有用武之地了!
    apollo007
        102
    apollo007  
       2025 年 12 月 2 日


    OP ,这个白色的框框一直待在这里,感觉没有必要。其实从头到尾也不需要它出现。
    oldcai
        103
    oldcai  
    OP
    PRO
       2025 年 12 月 3 日
    @apollo007 你好,你是哪个版本,这个白色框框没有自动消失吗?
    apollo007
        104
    apollo007  
       2025 年 12 月 3 日 via iPhone
    @oldcai #103 是 1.8.1 版本的,macmini ,系统是 15.7.2 ,语音输入是耳机
    oldcai
        105
    oldcai  
    OP
    PRO
       2025 年 12 月 3 日
    @apollo007 早期版本的 mac 的确可能有这个问题,下个版本修复一下
    apollo007
        106
    apollo007  
       2025 年 12 月 3 日 via iPhone
    @oldcai #105 谢谢。我注意到 1.7.2 这个版本的软件是没有这个问题的。我的设备是 Mac mini M4 。最新的设备,最新的软件
    skymanv2
        107
    skymanv2  
       2025 年 12 月 24 日
    默认的 grop 是不是禁止 cn ip 访问了,打开显示被禁止
    oldcai
        108
    oldcai  
    OP
    PRO
       2025 年 12 月 27 日
    @skymanv2 groq 可能要搬梯子才能用。
    JackalZhao
        109
    JackalZhao  
       1 月 4 日
    使用了,真的效果非常好,我用的是 sensevoice 。

    反馈点问题:

    1. 鼠标按键的监听是正常的,但是键盘上的 ctrl win shift alt 这些单个的按键没有办法监听到。CapsLock 可以监听到,但长按时并不能如愿工作,无法做到长按录音,刚按下去 0 点几秒就结束了。
    2. 快捷键的可选按键太少了,鼠标按键映射的 F13 - F24 也检测不到,可不可以通过输入字符串解析快捷键?


    提一些建议:

    1. 加入基于拼音匹配的本地热词,对于几千个人名、股票名字、公司名字可以很好的快速的匹配。
    2. 对于长按功能,在按键按下的时候就开始录音,只有当松开之后计算的时间小于 0.3 秒时就抛弃录音,当超过 0.3 秒阈值的时候就进行转录,这样可以避免按键按下之后等待触发的时间,用户可以按下按键之后就直接说话。
    3. 阿里巴巴的 Fun-ASR-Nano 最近刚刚发布了,希望可以加入,不过它的时间戳功能还需要一段时间才能发布。
    4. Fun-ASR-Nano 和 whisper 对性能要求高,如果有独显的话,希望能独显加速。
    1  2  
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2651 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 50ms · UTC 15:31 · PVG 23:31 · LAX 08:31 · JFK 11:31
    ♥ Do have faith in what you're doing.