[repost ]使用Alize等工具构建说话人识别平台
original:http://ift.tt/11QhuEb 前段时间有好几位同学询问如何用Alize实现说话人识别的问题,由于寒假前赶Paper,来不及详细解答,更没时间写Demo。 开学后不久抽时间写了一个Demo,并上传到了GitHub:VoicePrintReco-branch-master. 基本流程 下面将利用Alize+SPro进行简单的GMM-Based的说话人识别的基本流程总结如下: 1.Features extraction 特征提取 sfbcep.exe(MFCC)或slpcep.exe(LPCC) 2.Silence removal 静音检测和去除 NormFeat.exe 先能量规整 EnergyDetector.exe 基于能量检测的静音去除 3.Features Normalization 特征规整 NormFeat.exe 再使用这个工具进行特征规整 4.World model training TrainWorld.exe 训练UBM 5.Target model training TrainTarget.exe 在训练好UBM的基础上训练training set和testing set的GMM 6.Testing ComputeTest.exe 将testing set 的GMM在training set的GMM上进行测试和打分 7.Score Normalization ComputeNorm.exe 将得分进行规整 8. Compute EER 计算等错误率 你可以查查计算EER的matlab代码,NIST SRE的官网上有下载DETware_v2.1.tar.gz 。_ 获取帮助 关于各步骤中参数的问题,可以在命令行“工具 -help”来查看该工具个参数的具体含义,另外还可参考Alize源码中各个工具的test目录中提供的实例, 而关于每个工具的作用及理论知识则需要查看相关论文。 常见问题及解答: […]
via WordPress http://ift.tt/1FlFwpX
via WordPress http://ift.tt/1FlFwpX
Labels: hanhuiwen
0 Comments:
Post a Comment
<< Home