V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
iloveoovx
V2EX  ›  Android

目前语音识别的性能到什么地步了?

  •  
  •   iloveoovx · Sep 28, 2017 · 13912 views
    This topic created in 3133 days ago, the information mentioned may be changed or developed.

    想问一下,如果在密码输入这个场景下通过语音来识别字符,性能怎样?

    具体来说,密码输入这个场景意味着

    • 安全性,也就是说可能识别处理最好在本地进行;

    • 相对简单无需智能语义解析,大部分密码就是 0-9 的数字以及 a-z 的字母。在这个基础上,可能会加入一些描述性的综合识别来识别大写字母和符号,比如“大写的 a ”会自动识别成“ A ”,“逗号”识别成“,”,而类似 @则可以支持通过“ at ”和“ a 外面一个圈”等多种描述来输入,甚至加入“后退”等命令来在输入错误时进行删改。

    • 低延时,从发声到识别大概在 100ms 内,让语音输入有打字般的感觉。

    • 在安卓主流高端芯片如 SD835 上运行。

    目前性能能达到这种要求吗?

    9 replies    2017-10-01 06:14:24 +08:00
    scinart
        1
    scinart  
       Sep 28, 2017
    现在离线语音识别各家都有了吧,性能和准确性也应该都不是问题。
    oott123
        2
    oott123  
       Sep 28, 2017 via Android
    然后你输个密码你旁边的人都听到了?略尴尬啊~~
    iloveoovx
        3
    iloveoovx  
    OP
       Sep 28, 2017
    @oott123 并不考虑这种问题,毕竟这只做一个备用方案就好,适合你独处但手不方便的时候。
    hatw
        4
    hatw  
       Sep 29, 2017
    其实目前最大的敌人是。。。环境。。。噪音。。。
    chenyu8674
        5
    chenyu8674  
       Sep 29, 2017
    忽略干扰(噪音、口音)的前提下应该不难
    先靠语音听写把语音转为文本,然后按自定义规则对文本进行二次加工
    EmmaSwan
        6
    EmmaSwan  
       Sep 29, 2017
    我觉得比较合适的做法是,特定语汇自动替换,比如你说"美女",识别并转换为 A.你说丑女,为 B.这样,别人听到也没啥
    chenyu8674
        7
    chenyu8674  
       Sep 29, 2017
    @EmmaSwan 考场中学霸突然扔笔大喊操,啊,大爷的,操,八嘎,学渣默默涂上 CADCB 么 =。=
    parametrix
        8
    parametrix  
       Sep 29, 2017
    结合声音特征的 生物+密码 混合认证应该可用性更高吧,公开场合也不担心别人听去了。

    “适合你独处但手不方便的时候”这种场景真是让人浮想联翩。。。(滑稽
    iloveoovx
        9
    iloveoovx  
    OP
       Oct 1, 2017
    @parametrix 哈哈,其实是 AR 或者 VR 的时候,没有实体键盘可用
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1421 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 39ms · UTC 17:09 · PVG 01:09 · LAX 10:09 · JFK 13:09
    ♥ Do have faith in what you're doing.