上课点名系统声纹识别算法的设计与实现

发布时间:2017-05-08

说话人识别技术M是上课点名系统研究开发中选用的 专业核心技术,同时这也是影响和决定该系统各项性能以及 可用性的重点实现部分。从PC端成功接收移动端发送的语 音信息开始,直到PC端显示结果前,由说话人识别/确认模 块进行智能处理和模式识别,从而判断出话者的身份(是否 为同一人)。一个完整的说话人识别过程通常可分为2个阶 段:训练阶段与识别阶段。从功能上,则可以分为3个功能模块:特征提取、模型训练和模型打分。
 
在宏观思维上,文本无关说话人识别可分为说话人辨识和 说话人确认。其中,说话人辨识是判定说话人是一群说话人中 哪_个,而说话人确认则是确定说话人是不是某_个说话人。 具体推断可知,上课点名系统可明确归至说话人确认。在训练 阶段,首先在PC端由特征提取模块实现对输入语音的参数提 取,然后再经由模型训练模块得到相应的说话人模型,模型是 对说话人特征的进一步抽象。而在识别阶段,对移动端传来的 测试语音进行特征提取后,将利用模型给测试语音来完成打 分,并经过不同的判决准则,由此得到最终的判决结果。
上课点名 声纹识别