“国音-清华”联队荣登国际权威声纹竞赛NIST CTS 2020榜首

2021-12-17

公司动态

“国音-清华”联队荣登国际权威声纹竞赛NIST CTS 2020榜首

近日，由美国国家标准技术署（NIST）主办的NIST CTS 2020声纹识别评测研讨会公布最新榜单，国音智能与清华联合团队（队名：THUEE）荣登榜首，再次以实力证明国音声纹技术在全球的领先地位。

声纹领域影响力最大、历史最悠久的评测

NIST主办的声纹识别评测，从上世纪90年代末开始举办，每1-2年举办一次，是声纹领域历史最悠久的系列比赛，同时也代表了全球声纹识别领域最高水准，是声纹识别领域影响力最大、历史最悠久的评测。

本届NIST CTS 2020比赛，共有世界各地33支队伍、五十多个单位参赛，包括美国麻省理工学院(MIT)、约翰霍普金斯大学(JHU)、日本NEC、新加坡科技研究局(A*STAR)、法国国家信息与自动化研究所(INRIA)、清华大学、中科院声学所、语言及语音信息处理国家工程实验室、厦门大学、俄罗斯语音技术中心(STC)、国音智能等众多国内外一流高校、研究机构和企业。经过一年多紧张激烈的角逐，国音-清华联队从众多高手中脱颖而出，最终名列第一。

2021年是国音智能人工智能技术持续彰显能力的一年。在声纹领域的两大主要赛事中，许敏强博士带领的国音智能算法团队，先是在9月份获得了由牛津大学主办的VoxSRC 2021声纹识别比赛双赛道冠军，又在12月份美国国家标准技术署（NIST）声纹识别评测研讨会公布的NIST CTS 2020最新榜单中排名第一。值得一提的是，这两个比赛都是最近几年中国团队首次获得第一名，代表了中国人工智能能力在声纹领域的持续进步和突破。此外，2021年国音智能在语音识别等领域厚积薄发，在业务评测中准确率也排名第一。

创造性可重参化声纹建模技术

此次比赛，国音智能基于对比赛任务的深刻理解，提出了可重参化的声纹建模方法RepSPKNet，在大数据支撑下，采用超大规模训练框架，依托大模型训练的算力中心，结合分段式训练、多算法融合策略，最终在比赛中脱颖而出。

ResSPKNet在比赛中，彰显了其强大的能力。以比赛的指标min-cost衡量，ResSPKNet单模型的性能，达到了0.068，明显优于排名第二的STC多模型系统0.074。

厚积薄发，助力城市数字化转型

自2015年成立以来，国音智能持续发力智能语音语义和视觉分析等领域，立志打造业界顶尖的人工智能技术团队。国音智能逐渐开拓更多业务领域，包含多媒体数字智能专家（旗下SpeakIn品牌）、智能物联网（AIOT）人机交互解决方案、城市人工智能公共算法算力平台三大板块，助力城市数字化转型。

自今年11月国音智能启用全新品牌Neural.AI以来，不断探索“感知智能”向“认知智能”转变，将数字科技变成城市新生命线，为城市数字化转型贡献技术变更及产业发展的力量。

上一条

返回新闻中心列表

下一条