2021-12-17

公司动态

“国音-清华”联队荣登国际权威声纹竞赛NIST CTS 2020榜首

近日,由美国国家标准技术署(NIST)主办的NIST CTS 2020声纹识别评测研讨会公布最新榜单,国音智能与清华联合团队(队名:THUEE)荣登榜首,再次以实力证明国音声纹技术在全球的领先地位。


声纹领域影响力最大、历史最悠久的评测

NIST主办的声纹识别评测,从上世纪90年代末开始举办,每1-2年举办一次,是声纹领域历史最悠久的系列比赛,同时也代表了全球声纹识别领域最高水准,是声纹识别领域影响力最大、历史最悠久的评测。

本届NIST CTS 2020比赛,共有世界各地33支队伍、五十多个单位参赛,包括美国麻省理工学院(MIT)、约翰霍普金斯大学(JHU)、日本NEC、新加坡科技研究局(A*STAR)、法国国家信息与自动化研究所(INRIA)、清华大学、中科院声学所、语言及语音信息处理国家工程实验室、厦门大学、俄罗斯语音技术中心(STC)、国音智能等众多国内外一流高校、研究机构和企业。经过一年多紧张激烈的角逐,国音-清华联队从众多高手中脱颖而出,最终名列第一。

2021年是国音智能人工智能技术持续彰显能力的一年。在声纹领域的两大主要赛事中,许敏强博士带领的国音智能算法团队,先是在9月份获得了由牛津大学主办的VoxSRC 2021声纹识别比赛双赛道冠军,又在12月份美国国家标准技术署(NIST)声纹识别评测研讨会公布的NIST CTS 2020最新榜单中排名第一。值得一提的是,这两个比赛都是最近几年中国团队首次获得第一名,代表了中国人工智能能力在声纹领域的持续进步和突破。此外,2021年国音智能在语音识别等领域厚积薄发,在业务评测中准确率也排名第一。



创造性可重参化声纹建模技术

此次比赛,国音智能基于对比赛任务的深刻理解,提出了可重参化的声纹建模方法RepSPKNet,在大数据支撑下,采用超大规模训练框架,依托大模型训练的算力中心,结合分段式训练、多算法融合策略,最终在比赛中脱颖而出。

ResSPKNet在比赛中,彰显了其强大的能力。以比赛的指标min-cost衡量,ResSPKNet单模型的性能,达到了0.068,明显优于排名第二的STC多模型系统0.074。



厚积薄发,助力城市数字化转型

自2015年成立以来,国音智能持续发力智能语音语义和视觉分析等领域,立志打造业界顶尖的人工智能技术团队。国音智能逐渐开拓更多业务领域,包含多媒体数字智能专家(旗下SpeakIn品牌)、智能物联网(AIOT)人机交互解决方案、城市人工智能公共算法算力平台三大板块,助力城市数字化转型。

自今年11月国音智能启用全新品牌Neural.AI以来,不断探索“感知智能”向“认知智能”转变,将数字科技变成城市新生命线,为城市数字化转型贡献技术变更及产业发展的力量。