该论文根据以下五个技术要求来评价目前常用于特征识别技术的六大生物特征——指纹、人脸、虹膜、掌纹、静脉纹、声纹:
人证合一性 ,证件和持有人应该一一对应,每个人有唯一且准确的个人证件;不易伪造性 ,不易复制,进行活体检测时应该具备抵御假体(伪造或冒充)攻击的能力;意图真实性 ,必须体现用户的真实意图,即使用者的认证过程并非是在无意识或受胁迫条件下进行的;证据可溯性, 当前可作为认证证据的特征可以提供历史认证的时间和空间信息;认证便宜性,认证成本低、方便(对平台和设备的依赖差)。 基于密码/口令的传统身份认证方式无法较好地满足以上五条要求,因此生物特征识别技术成为了当今无监督认证研究的热潮。图1: 常见生物特征“五性”符合性比较
声纹是说话人语音中能表征该说话人身份的语音特征。基于语音信号的声纹是最符合“五性”要求的,它有以下诸多优势:同时具备接收和发出信息的能力、兼具生理特征和行为特征外、通过分析这种简单的一维信号还能得到例如内容、性别、语种、情绪等众多信息。
“声纹+”是一种可信身份认证架构与技术策略。旨在为用户提供高安全、真意图、弱隐私、低成本的认证服务,它以声纹为关键因子,综合其他认证因子(例如动态密码、人脸、手势、情感等等)。
基础策略:“声纹+动态密码” 首先由服务器向用户端提供一个不重复的动态密码文本,客户端采集用户在客户端读密码的语音后再返回服务器端。这里服务器端运用了语音和声纹的双重识别:其中语音识别用于判断用户读出的动态验证码是否正确,而声纹识别用于判断读出这段验证码的声音是否来自用户本人。 图2: 动态声纹密码身份认证系统架构与流程示意
“声纹+多生物特征融合” 是一种以声纹为基础,综合其他的生理特征或行为特征来进行身份认证的策略。例如:声纹+人脸、声纹+指纹、声纹+手势、声纹+唇语等等。
“声纹+情感检测” 主要出于安全角度的考虑,特别是当不法分子要挟劫持使用者时,违背使用者意图进行的操作是不被允许的。通过检测使用者声音的情绪波动,对语音的外界干扰情况做出合理的判断。这一项符合安防声纹识别系统的应用前景,在认证过程中发现异常时及时向后台系统发出警告。
“声纹+自定义密码” 用户可根据自身习惯添加自定义的发音规则,使认证过程充满个性的同时也更加安全。
“声纹+时空防伪” 因为动态验证码的生成具有时间信息、声纹识别在不同时间和场景中具有差异性,故而可利用时间和空间的差异性支持反向追查。