Sonar v2.0:开放式说话人识别研究平台的设计、实现和推广
摘要 | 第1-5页 |
Abstract | 第5-12页 |
第1章 背景与概述 | 第12-17页 |
·说话人识别技术概述 | 第12-13页 |
·课题背景 | 第13-14页 |
·现有软件平台概述 | 第14-15页 |
·课题意义 | 第15-16页 |
·工作重点和论文组织结构 | 第16-17页 |
第2章 理论和技术基础 | 第17-36页 |
·说话人识别基本流程和原理 | 第17-18页 |
·特征 | 第18-20页 |
·线性预测系数倒谱参数(LPCC) | 第18-19页 |
·Mel刻度倒谱系数(MFCC) | 第19-20页 |
·模型 | 第20-25页 |
·模板模型 | 第21-22页 |
·生成型模型 | 第22-24页 |
·区分型模型 | 第24-25页 |
·得分归整优化 | 第25页 |
·性能评价 | 第25-26页 |
·例子系统分析: Alize Toolkit | 第26-35页 |
·系统架构 | 第27页 |
·Feature Server | 第27-29页 |
·Model Server | 第29页 |
·Stat Server | 第29-35页 |
·本章小结 | 第35-36页 |
第3章 Sonar v2平台设计和实现 | 第36-54页 |
·系统流程描述 | 第36-37页 |
·系统架构设计 | 第37-38页 |
·系统文件格式定义 | 第38-41页 |
·特色批量处理系统设计 | 第41-44页 |
·核心模块设计 | 第44-52页 |
·通用构件模块 | 第45-48页 |
·音频获取模块 | 第48页 |
·特征模块 | 第48-49页 |
·模型模块 | 第49-50页 |
·评测模块 | 第50-52页 |
·Sonar系统特点 | 第52-53页 |
·集成性 | 第52页 |
·封装性 | 第52页 |
·兼容性 | 第52-53页 |
·可剪裁性和可扩展性 | 第53页 |
·本章小结 | 第53-54页 |
第4章 Sonar v2的教学平台建设和系统推广 | 第54-71页 |
·教学平台建设 | 第54-66页 |
·入门篇──友好的用户界面 | 第54-56页 |
·提高篇──利用 API 进行二次开发 | 第56-60页 |
·演练篇──自动练习检查系统 | 第60-66页 |
·系统推广 | 第66-69页 |
·基于 Sonar v2的算法评测 | 第66-68页 |
·用户体验调查和系统改进 | 第68-69页 |
·本章小结 | 第69-71页 |
第5章 Sonar平台测试和性能分析 | 第71-82页 |
·代码级──功能单元测试 | 第71页 |
·平台级──准确性分析 | 第71-79页 |
·NIST 库评测性能分析 | 第72-74页 |
·YOHO 库评测性能分析 | 第74-77页 |
·Sonar v2 和 Alize的准确性比较 | 第77-79页 |
·系统级──运行开销分析 | 第79-81页 |
·空间效率分析 | 第79-81页 |
·时间效率分析 | 第81页 |
·本章小结 | 第81-82页 |
第6章 总结和展望 | 第82-84页 |
参考文献 | 第84-87页 |
攻读硕士学位期间主要的研究成果 | 第87-88页 |
致谢 | 第88-89页 |
附录一 《Sonar用户体验调查》 | 第89-92页 |