人力和自动语音识别在感知修复实验中的对比
资料介绍:
人力和自动语音识别在感知修复实验中的对比(中文7000字,英文PDF)
摘要
被频谱或时间间隙扭曲的语音仍被人类听众视为连续和完整的,只要间隙中填充油足够强度的加性噪声。当这样的感性修复发生时,相对于在间隙中尚未加入噪声的情况来说,讲话也更容易理解。这种观点已促使所谓的“丢失的数据”系统的自动语音识别(ASR),但几乎没有这样的实验可以确定这些系统是否是人类听众知觉恢复的良好典范。因此,当前的论文评估了在感知恢复任务中丢失的数据的ASR。我们评估了两种使用新方法,以有限的边缘化的倒谱域,有界条件平均估算法的系统。这两种方法都可以使模型语音信息作为一种清洁的语音后验分布随后被传递到ASR系统。这里提出的数据缺失ASR系统使用处理后的语音进行评估,其中频谱-时间差距被选择性的充满了加性噪声。所提出的系统的语音识别性能将与基线ASR系统,以及与在相同的任务下人类语音识别的性能相比较。我们的结论是丢失数据的方法,是以与人类听众知觉恢复一致的方式提高了语音识别性能。
关键词:自动语音识别;缺失数据;观察的不确定性;知觉恢复;传播的不确定性
[版权所有:http://DOC163.com]
[资料来源:http://doc163.com]