2017-08-17
8月10日,SpeakIn亮相iWorld2017数字世界博览会,向现场观众展示了SpeakIn声纹识别技术在智能硬件、公安、金融和社保行业的应用场景和案例。
SpeakIn首席运营官易鹏宇也在本次博览会上接受凤凰网四川专访,就SpeakIn的近况及未来声纹识别技术发展问题回答了记者的提问并分享了自己的观点与看法。
作为一家新兴的AI公司,SpeakIn涉足声纹识别这一领域后顺势而起,在2015年5月获得数千万元天使轮融资后,今年5月又顺利的完成了由IDG资本(隶属于中国泛海集团)领投的数千万元新一轮融资。SpeakIn创始人兼CEO陈昊亮也凭借着在声纹领域的杰出表现入选企业科技领域30U30榜单。
在激烈的市场竞争中,SpeakIn是凭借什么优势脱颖而出获得投资人青睐,未来声纹识别技术又将如何发展?以下是记者对SpeakIn易鹏宇的访谈实录:
记者:根据我的了解,SpeakIn是一家专注声纹识别和身份安全的人工智能公司,最开始为什么要选择这样一个领域切入呢?然后请您介绍一下SpeakIn具体是做一些什么样的事情呢?
易鹏宇:SpeakIn起源于美国硅谷,专注于声纹识别与身份安全领域,主要面向全球提供领先的解决方案和专业服务。
在进入人工智能时代以来,微软、谷歌等公司逐渐解决了声音输入的问题,给我们带来了智能音箱、智能可穿戴设备后,声音识别的研究已经开始从‘说的什么’演进到‘谁在说话’了。所以在我们看来,在未来智能硬件和物联网领域,声音的这个身份特质,也就是声纹对金融安全、社保、公共安全领域都会是非常重要的技术。
比如在公共安全领域,我们和某省公安厅合作,解决了电信诈骗的问题;在社保领域引入声纹验证技术,每个月通过一个电话就首先能确认领保人身份,不需要再去社保局按指纹,这是能从社会层面能方便大家,提升效率的一件事;在金融领域,我们帮助互联网金融借贷公司识别借款人身份,预防借贷欺诈;在智能家电领域,我们已经和跟腾讯Qrobot机器人合作。再远一点,未来腾讯IoT 用QQ号登录的多种硬件都会使用我们的技术。
这些场景的实现,都基于我们对学术界最前沿、基于深度学习的声纹识别技术的应用。到目前我们也已经拥有了活体检测、情绪识别、性别识别、人声分离、声纹大数据检索与对比等核心技术。在未来希望把在声纹识别这一领域积累的数年经验运用到整个市场中,并且进入不同的场景后,用核心技术建立起行业壁垒。
记者:那么以这样一个领域作为创业的落脚点,那么市面上也有很多这类的人工智能公司,那您觉得SpeakIn是凭借着什么获得了资本的青睐,什么样的核心技术打动了投资人呢?
易鹏宇:技术发展到今天,仅凭纯粹的技术领先的时间是有限的。当然我们也是有领先技术的,我们的初始团队源自硅谷,大量的技术人员来自香港科大、中科大等名校,研发人员来自BAT 等,整个团队在这方面很有经验。
但更重要的是,我们在整个市场里进入到了场景里面。其实我觉得未来更有价值的是进入场景形成方案,建立壁垒。就好像现在微信支付和支付宝他们技术上有多大差别,其实没有。但他们建立的壁垒是说我在哪个商家用的更多,在哪个场景下用得更多。比如为发红包那一定是微信,但在淘宝购物时肯定是用支付宝,而线下各有所长。未来的竞争是建立在固定场景下。如果说今天SpeakIn首先进入了公关安全、社保、金融领域,在里面我们就会有积累。
记者:提到未来,刚才您也提到了一些关于支付的场景,那么除了这些您还有什么样的想法,对于这个行业还有什么样的看法?
易鹏宇:现在是场景切入,但从更长远来讲,声音一定会成为个人一个更自然的身份。在物联网社会里,我们会使用,或是会需要确认身份,这时候人脸、指纹、声音这些生物特征就会成为最自然、最好用、不会丢失的身份。有一天你可能会忘记自己的手机号、密码,但自己的生物特征是不会被忘记的。所以从长远来讲,生物特征一定会成为下一个时代的身份信息。有了身份特征,随之而来的,更直接的会与支付相关,或消费相关的场景。
我们看好生物特征识别相关技术进入到生活的各个领域,“将来网络世界与物理世界将会高度融合,人与人、人与设备之间的交流,最终会回归到符合人类自然行为习惯的本质。”
这也意味着,多样性的电子身份识别将逐渐进入人工智能时代,人们对身份认证的新追求会越来越偏向于“简单、易用、安全、低成本、互认”等几个方面。
在采访的最后,易鹏宇表示:未来随着声音识别技术的普及,SpeakIn也会利用人工智能不断创新,并针对细分行业去获得数据、让机器去学习,去更好地为细分行业的目标群体服务。