2017-04-28

来源:雷锋网

媒体报道

从《人民的名义》看声纹识别技术在案件侦查中的应用

被号称为“史上最大尺度反腐剧”的《人民的名义》即将收官,播出期间,该剧一直备受好评。除了曲折的故事情节之外,该剧最大的看点就是公安机关曲折的案件侦查过程,只不过因为剧中涉及到了贪污受贿犯罪案件、刑事案件、经济案件等一系列犯罪事件,错综复杂的关联和故事情节给案件侦查带来了巨大的麻烦。

下面这一幕,相信大家对还有印象:

在《人民的名义》第21集,剧中反贪局长侯亮平与京州市公安局局长赵东来一行在拳击场就陈海车祸案件进行探讨分析时,陈海在车祸前共接到两个举报电话,京州公安局将两个电话交由不同技术部门进行了两次鉴定,得出了两个举报人的声音并非是举报人蔡成功同一个人。

显然,声音的鉴定给公安机关提供了侦查案件的关键证据和调查方向。

随着科技的发展,尤其是生物科技的不断发展并逐渐广泛应用,包括人脸、指纹、掌纹、声纹等生物特征类证据已成为公安和司法机关破案侦查的重要证据之一,在热播的《人民的名义》中,声音就成了调查原汉东省检察院反贪局局长陈海车祸案件的重要线索。

这种通过提取说话人声纹特征来辨别身份的技术被称为声纹识别,特别适用于在无法当面见到当事人的情况。

声纹识别是如何辨别说话人身份的?

众所周知,每个人发音讲话都是通过鼻腔、口舌、声道、胸肺几大器官多重配合的结果,不同人声音的频率、音色、语调甚至口音等特质组成了独特的声纹图谱,包含音质、音长、音强、音高等,通过对这些特征的比对,从而能够实现身份的认证。

声纹识别的过程就是通过录音设备把声音信号转换成电信号,再用信号处理算法提取以上特征,然后使用机器学习算法来识别说话人的身份。这种技术最早40年代末由贝尔实验室开发,主要用于战争时期军事情报领域,技术要求很高,随着科技的发展目前已经开始逐渐被应用到了案件侦查以及金融等商业应用。

声纹识别与身份安全解决方案提供商SpeakIn(势必可赢科技)分析介绍:“在《人民的名义》剧情中,公安刑侦人员通过分析两段电话录音中的音素,比对两段音频中共同音素的频谱,判断两个音素是否来自于同一人。通常来说,如果两段音频存在20个匹配的特征点,那就可以推断是同一人的声音,反之则是不同人的声音。这是声纹身份验证应用中的1:1比对方式”,它的目的是确认语音是否来自某个人,也就是说话人的确认。

此外,在声纹领域还有一种方式是通过1:N的方式来进行声纹对比,它是将一个人的声音与现有声纹数据库中的声纹数据进行对比,进而找出最有可能的说话人,简单来说就是判断语音是哪个人说的,也被称为说话人辨认。这种方式在重点人群监控、犯罪嫌疑人排查以及案件司法证据鉴定方面广泛运用。

SpeakIn表示,过去声纹识别的对比通常采用人工经验,通常情况下通过人工进行对比2~15分钟的音频需要半天到一天的时间。现在通过人工智能,采用机器学习的自动化方法,通过大数据样本序列进行自动化分析,只需要数秒就能判定出结果。更先进的科技技术,也带来了更高效、智能、安全可靠的鉴别服务。

事实上,就如《人民的名义》里所讲的一样,声纹鉴定如今已成为公安司法机关检查办案的关键证据之一,通过语音声纹的对比分析鉴定,可以锁定嫌疑人,进而查找出嫌疑人的性别、年龄、户籍等重要信息,为侦查破案工作提供线索,从而大幅度提高了公安机关的办案效率,降低了办案成本。

国内声纹识别创业公司已经领先全球

声纹识别的准确率是声纹识别最重要的指标之一,全球主要的声纹识别技术厂商都在不断努力提升这一指标。

据雷锋网(公众号:雷锋网)了解,在日常环境中使用短语音进行注册和验证,SpeakIn的算法核心指标已经突破99.5%的准确率,达到了世界领先水平,这也标志着SpeakIn的声纹识别技术能够进行大规模的行业应用。从当前世界范围内发表的学术论文看,目前国内还没有第二家企业的声纹识别算法能够达到这一准确率。

这家公司又是什么来头呢?

2015年,SpeakIn创建于美国硅谷,目前总部位于深圳,本着“美国技术、中国研发、全球市场”的理念,这家公司已经在面向全球提供方案与服务,并且在多个领域实现了应用。

据了解,目前,SpeakIn已为国内多个地区的公安、金融、社保等机构和知名企业量身定制了基于声纹识别的身份安全解决方案,实现了多种创新型行业应用,提高了用户的安全体验。

雷锋网还了解到,SpeakIn的团队核心成员均来自哈佛大学、麻省理工学院、香港科技大学、香港中文大学、中国科学技术大学、微软亚洲研究院等国内外顶尖高等学府和科研机构,SpeakIn云集了一批顶尖的声纹识别算法与机器学习的科学家和来自BAT等知名互联网企业的产品研发团队,无论是科研实力及产品研发能力,SpeakIn都已经走在了前列。