近日,国家知识产权局网站上公开了百度一系列针对移动设备和服务的安全专利,专利内容显示,百度正试图使用语音技术让移动用户体验更加安全便利。
根据公开资料中的描述,该系列专利可“基于特定人的声音特征提取相应的特征码,从而实现对用户移动设备、支付及其他互联服务的无文本密码登录操作”。根据这几份专利而形成的百度声纹安全专利方案,很好地平衡了使用方便和保证安全两个方面的需求,据百度语音研发团队透漏,该方案已初步应用于手机百度,未来还将在贴吧、百度Hi等账号登录应用及百度钱包等移动支付系统上使用。
新专利完美平衡便利性和安全性
随着语音技术的成熟和发展,声纹识别已经成为继指纹识别之后又一基于生物特征的识别和鉴权技术。目前的声纹认证技术主要分为文本无关和文本相关两种。文本无关的声纹认证技术对用户说的内容不加区分,而文本相关的声纹认证技术需要用户说的内容与注册时必须一致,这两种技术各有优缺点。而百度的声纹识别专利则结合了两者的优点,采用了基于限定文本的声纹验证,用户在注册阶段说几个固定的短文本,在认证阶段说有限个短文本的组合,从而实现具有一定文本自由度的声纹认证。
通过对多项专利技术的组合,百度提出了基于随机数字串文本的声纹验证模式,用户设定声纹特征时录入10个数字的组合,并将其作为用户个人的特征码,当用户需要使用声纹登录或者支付时,将会被要求读出此前录入的10个数字中的6个数字组合,系统将提取用户读出的6个数字组合的声纹特征,并与此前录入的特征进行比对,如吻合则认证成功。
此外,为了进一步提高安全系数,用户还可以设定用特殊字符替代解锁时显示的某些数字,相当于给声纹解锁再加上了一道密码锁。
实际应用过程优于现有技术方案
相比需要增加相应硬件的指纹识别技术,声纹识别技术的优势在于几乎所有设备都可以在无需增加识别设备硬件的前提下实现这一功能。依靠深度学习技术、大数据引擎和百度大脑的支撑,百度声纹识别技术会记录用户每一次登录的使用,并对特定用户的声音进行建模和学习,登录次数越多,用户的声音模型越完整,对声音识别的采集精确度越高,越不容易被盗用,进一步提高了声纹识别的整体安全性。
目前,BAT三家公司都已经在自己的移动服务上应用了声纹识别技术。例如微信新版升级之后就可以通过朗读8个数字进行声纹特征匹配,之后就可以用这几个数字进行登录。不过,腾讯采用的是固定数字,相比百度的随机数字组合,固定数字很容易被录音模仿和伪造。而如果要求用户对每个数字进行单独录音,则无法记录特定用户在朗读连续数字时出现的连读变调特征,导致实际使用中的特征比对失败。另外,微信的登录文本只要读对一部分即可登录,而百度声纹识别需要有100%的准确率才能打开相应的应用,更加安全便利。
此外,支付宝此前也在客户端推出了声波支付,在支付时手机发出固定的声波频率,由对方设备获取后上传服务器进行比对,比对成功则可以完成支付。不过和百度声纹技术锁定的是用户个人不一样的是,支付宝的声音特征是与手机进行绑定的,如果用户手机不在身边,则无法完成付款,而百度声纹技术则只要用户本人在场,使用任何客户端或移动服务都可以完成支付,为用户提供更便利的服务。
百度的这一系列声纹识别专利,不仅是对已有技术研发成果的积极保护,更重要的是将抢占语音技术战略、语音产品战略的制高点,为百度引领行业技术与产品战略走向奠定基础。同时,对“声音”这一重要生物识别介质的充分利用,将令百度系列产品的移动体验更加便利安全,让百度“技术改变O2O”的未来愿景,更引人遐想。