说话人性别识别和年龄估计的系统研制

摘要	第5-6页
Abstract	第6-7页
第一章绪论	第11-16页
1.1 研究意义	第11页
1.2 研究现状及难点	第11-13页
1.3 本论文研究内容及结构安排	第13-16页
1.3.1 研究内容	第13-14页
1.3.2 结构安排	第14-16页
第二章系统原理及相关技术分析	第16-29页
2.1 说话人识别原理	第16-17页
2.2 语音信号的预处理	第17-19页
2.2.1 预加重	第17页
2.2.2 分帧和加窗	第17-18页
2.2.3 语音信号的端点检测	第18-19页
2.3 语音信号的特征参数提取	第19-25页
2.3.1 时域特征参数	第19-21页
2.3.2 梅尔频率倒谱参数	第21-24页
2.3.3 与说话人性别和年龄相关的其他参数	第24-25页
2.4 GMM模型	第25-28页
2.4.1 GMM模型原理和定义	第25-26页
2.4.2 GMM模型的参数估计	第26-28页
2.4.3 GMM模型的识别	第28页
2.5 本章小结	第28-29页
第三章最优特征参数选择实验	第29-38页
3.1 前期处理	第29-30页
3.2 混合特征提取	第30-33页
3.2.1 选取的理论依据	第31页
3.2.2 相关原理和实现方法	第31-33页
3.3 基于GMM的模型训练和识别	第33-35页
3.4 实验与结果分析	第35-37页
3.4.1 实验的软硬件环境和数据	第35页
3.4.2 识别性能实验与结果分析	第35-37页
3.5 本章小结	第37-38页
第四章系统设计与实现	第38-47页
4.1 系统功能要求	第38页
4.2 系统构建思路	第38-40页
4.3 系统模块设计与实现	第40-46页
4.3.1 语音文件输入	第40-41页
4.3.2 端点检测	第41-42页
4.3.3 特征提取	第42-44页
4.3.4 GMM模型训练	第44-45页
4.3.5 识别方式选择	第45页
4.3.6 GMM模型识别	第45-46页
4.3.7 识别结果显示	第46页
4.4 本章小结	第46-47页
第五章系统测试与结果分析	第47-64页
5.1 实验的软硬件平台	第47页
5.2 数据库的建立	第47-49页
5.3 系统使用说明	第49-54页
5.4 影响系统识别率因素实验	第54-58页
5.4.1 不同样本时长识别率实验	第54-56页
5.4.2 不同样本帧长识别率实验	第56-57页
5.4.3 不同样本来源识别率实验	第57页
5.4.4 不同高斯混合阶数识别率实验	第57-58页
5.5 系统功能测试及性能分析	第58-63页
5.5.1 在线功能测试实验	第58-60页
5.5.2 离线功能测试实验	第60-62页
5.5.3 性能分析	第62-63页
5.6 本章小结	第63-64页
结论	第64-66页
参考文献	第66-70页
攻读硕士学位期间取得的研究成果	第70-71页
致谢	第71-72页
附件	第72页