再次斩获专利界“奥斯卡”!科大讯飞翻译机、录音笔重构语音交互体验

来源: 浏览

小编: 近日,被誉为专利界“奥斯卡”的第二十五届中国专利金奖项目名单由国家知识产权局正式公布,科大讯飞股份有限公司(以下简称“科大讯飞”)凭借“基于时

 近日,被誉为专利界“奥斯卡”的第二十五届中国专利金奖项目名单由国家知识产权局正式公布,科大讯飞股份有限公司(以下简称“科大讯飞”)凭借“基于时延估计的回声消除方法及装置”专利入选。这是继获得第二十二届中国专利金奖之后,科大讯飞第二次获得这一国内知识产权领域的最高奖项,同时也是安徽省唯一一家两次获得中国专利金奖的单位。

作为人工智能领域的“国家队”,科大讯飞自成立以来便深耕智能语音的技术研发,此次获奖专利正是其二十余年技术积累与持续创新的重要成果。

在智能语音交互系统中,回声消除技术是决定用户体验的核心环节——当我们通过智能设备进行语音交互时,麦克风会将你的声音及其在环境中形成的回声一起收录下来,这个回声会对智能设备形成干扰,导致设备无法准确领会你的指令。而传统回声消除方法面临着计算复杂度高、动态场景适应性差等瓶颈,难以在复杂环境中实现理想效果。

因此,为解决这一行业痛点,科大讯飞的“基于时延估计的回声消除方法及装置”专利提出了三大创新点:首先,通过基于相似度的异常频点检测技术,精准排除信号变形及说话人语音中的异常时频点,为后续处理奠定纯净信号基础;其次,研发统计与瞬时结合的动态时延估计算法,通过引入瞬时信息决策机制,有效应对实时交互中时延快速变化的挑战;最后,采用基于滤波器敏感追踪的实时消除技术,通过动态调整窗长并复用历史系数,将滤波器更新效率提升数倍,实现毫秒级响应的实时回声消除。

这项技术的核心原理可以通俗理解为:当设备麦克风收录声音时,系统首先通过时延估计算法精确计算扬声器声音到麦克风的传输时间差,继而基于这个关键参数构建动态滤波器,将扬声器回声从混合信号中精准剥离,最终保留纯净的用户语音。

基于这些核心创新,科大讯飞成功突破了传统回声消除技术在复杂场景中的应用瓶颈,让这项专利成果不再局限于实验室,而是真正转化为提升用户体验的实用价值。目前,该技术已深度融入科大讯飞智能终端产品矩阵,在消费级场景中绽放光彩。无论是需要在跨语言沟通中精准捕捉人声的讯飞翻译机,还是专注于清晰记录语音信息的讯飞录音笔,都运用了相关技术。

以科大讯飞最新推出的讯飞双屏翻译机 2.0为例,其核心降噪能力正是“基于时延估计的回声消除方法”的场景化延伸,其降噪模式能够依据不同的环境场景,智能分析声音特征,在保留有效语音信息的同时,精准过滤掉干扰噪音,实现对目标语音的精准提取。

简单来说,讯飞双屏翻译机 2.0会优先处理1米以内的近场人声,将其视为“主角”;而1米以外的环境音,则自动被识别为“干扰配角”,算法会对其进行削弱或滤除。这就好比在用户和翻译机之间拉起了一圈 “隐形的听力护栏”,将外界的嘈杂声音隔绝在外,让关键语音清晰传递。

此外,讯飞录音笔在办公场景的智能降噪,同样是该项专利技术的垂直化应用。其搭载的自研听感算法VF2.0,能够将“基于相似度的异常频点检测技术”与办公环境噪声特征库相结合,针对键盘声、空调声等80余类常见噪声的时频特征进行精准建模,并在录音过程中通过实时滤波器对这些噪声频段进行针对性抑制。

经过这样的技术处理,用户得到的录音文件中人声与噪声的分离度显著提升,使后期语音转写的准确率大幅提高,极大降低了人工整理录音的时间成本。无论是重要的商务谈判,还是密集的学术研讨,讯飞录音笔都能成为办公场景中高效可靠的语音记录助手,让每一个关键信息都能清晰留存。

从基础研究到场景落地,科大讯飞的专利技术在突破智能语音交互技术瓶颈上展现出强大潜力,未来有望构建从消费级到工业级的全场景应用生态。随着万物互联时代的到来,科大讯飞将以更便捷的技术实现更优质的智能服务,持续推动人机沟通向更智能、更自然的方向迈进。

当前网址:http://www.hbxwzx.com/shehui/2025-06-16/218039.html

免责声明:本文仅代表作者个人观点,与北方资讯网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

你可能喜欢的: