- 发布日期:2024-09-28 21:08 点击次数:163
中新经纬9月26日电 近日骚货,奇富科技受邀出席了在希腊举办的国外语音通讯与信号贬责顶级会议——INTERSPEECH 2024,并发表了题为Qifusion-Net: Layer-adapted Stream/Non-stream Model for End-to-End Multi-Accent Speech Recognition的主旨演讲,全面展示了其在语音识别时候鸿沟的建树,为中国语音时候走向宇宙、参与公共竞争拓荒了新的标杆。
INTERSPEECH看成公共语音科学界最负闻名的年度会议之一,集合了来自宇宙各地的顶尖学者、究诘东谈主员及行业首脑,共同磋议语音时候的最新进展、挑战与将来趋势。这一平台不仅代表了语音时候鸿沟的最高学术水平,亦然新时候、新理念雷同与碰撞的绝佳口头,其泰斗性和影响力在业界高高在上。
图1:奇富科技在INTERSPEECH 2024会议作念主旨演讲在演讲中,奇富科技先容了可同期守旧20多种方言的新一代奇富语音识别系统“QiFree”,这是国内金融行业内字错率最低的汉文语音识别系统。在汉文口音与方言语音识别鸿沟的泰斗测试集KeSpeech的对比中,奇富科技凭借其在自动语音识别(Automatic Speech Recognition, ASR)鸿沟的深厚积聚,终明晰方言口音分类准确率的权臣普及,达到了79.10%,远超KeSpeech的基线水平61.13%,情色电影种子这一数据直不雅反馈了奇富科技在语音识别准确性上的非常线路。同期,在估计识别空幻率的要津运筹帷幄——CER(Character Error Rate, 字符空幻率)上,奇富科技更所以8.08%的得益,远优于KeSpeech的10.38%,展现了其在汉文方言识别鸿沟的高效与精确。
表1:奇富科技“QiFree”性能效果与KeSpeech Baseline对比奇富科技自研的汉文语音识别系统“QiFree”,冲突了单一模子只可识别特定单一方言的逆境,通过转换的层自相宜交融结构,借助分享信息编码模块更高效的提真金不怕火方言信息,终明晰即说即译,进一步增强了语音机器东谈主的及时交互智商。值得一提的是,“QiFree”不仅在平凡话识别鸿沟的CER上保抓率先地位,更在冀-鲁、江淮、胶-辽、兰-银等多个方言区域的识别性能上,比拟过往最好得益终明晰越过15%的权臣普及。这一突破性效果得回了INTERSPEECH三位孤立审稿东谈主的高度招供,他们一致招供奇富科技论文《Qifusion-Net:基于特征交融的流式/非流式端到端多口音语音识别框架》所展现的系统框架转换性与识别性能的非常线路,并一致授予其“ACCEPT”的评定。
亚洲美女香蕉视频在线观看值得一提的是,在与国内一流公司(如某科技巨头及国内影响力最大的语音识别开源社区)的对比中,奇富科技同样展现出了压倒性的上风。即即是在濒临参数限制更大、推行数据量更丰富的敌手时,奇富科技照旧能以更低的CER(8.08% vs 15.61% vs 26.55%)脱颖而出,讲明了那时候架构的优胜性和算法优化的高效性。此外,与公共率先的语音识别系统(如Openai-whisper v2)比拟,尽管后者在通用讲话识别上具有权臣上风,但在汉文方言识别这一细分鸿沟,奇富科技照旧保抓了权臣上风,这进一步印证了其在方言识别时候上的公共率先地位。
表2: 奇富科技“QiFree”要津运筹帷幄与国表里一流科技公司对比奇富科技在INTERSPEECH 2024上的再一次精彩亮相,不仅是对其多年来在语音识别时候鸿沟深耕细作效果的一次全面展示骚货,更是向宇宙宣告了中国企业在这一鸿沟的弘大竞争力和无尽后劲。奇富科技正以其非常的时候实力和转换精神,引颈着方言识别时候的新一轮发展潮水,为公共语音通讯与信号贬责时候的跳跃孝顺着中国聪惠与中国力量。(中新经纬APP)