上课点名系统声纹识别算法的设计与实现

发布时间：2017-05-08

说话人识别技术M是上课点名系统研究开发中选用的专业核心技术，同时这也是影响和决定该系统各项性能以及可用性的重点实现部分。从PC端成功接收移动端发送的语音信息开始，直到PC端显示结果前，由说话人识别/确认模块进行智能处理和模式识别，从而判断出话者的身份（是否为同一人）。一个完整的说话人识别过程通常可分为2个阶段:训练阶段与识别阶段。从功能上，则可以分为3个功能模块:特征提取、模型训练和模型打分。

在宏观思维上,文本无关说话人识别可分为说话人辨识和说话人确认。其中，说话人辨识是判定说话人是一群说话人中哪_个，而说话人确认则是确定说话人是不是某_个说话人。具体推断可知，上课点名系统可明确归至说话人确认。在训练阶段,首先在PC端由特征提取模块实现对输入语音的参数提取，然后再经由模型训练模块得到相应的说话人模型,模型是对说话人特征的进一步抽象。而在识别阶段，对移动端传来的测试语音进行特征提取后，将利用模型给测试语音来完成打分，并经过不同的判决准则，由此得到最终的判决结果。

上课点名 声纹识别

返回列表