Sonar v2.0:开放式说话人识别研究平台的设计、实现和推广
| 摘要 | 第1-5页 |
| Abstract | 第5-12页 |
| 第1章 背景与概述 | 第12-17页 |
| ·说话人识别技术概述 | 第12-13页 |
| ·课题背景 | 第13-14页 |
| ·现有软件平台概述 | 第14-15页 |
| ·课题意义 | 第15-16页 |
| ·工作重点和论文组织结构 | 第16-17页 |
| 第2章 理论和技术基础 | 第17-36页 |
| ·说话人识别基本流程和原理 | 第17-18页 |
| ·特征 | 第18-20页 |
| ·线性预测系数倒谱参数(LPCC) | 第18-19页 |
| ·Mel刻度倒谱系数(MFCC) | 第19-20页 |
| ·模型 | 第20-25页 |
| ·模板模型 | 第21-22页 |
| ·生成型模型 | 第22-24页 |
| ·区分型模型 | 第24-25页 |
| ·得分归整优化 | 第25页 |
| ·性能评价 | 第25-26页 |
| ·例子系统分析: Alize Toolkit | 第26-35页 |
| ·系统架构 | 第27页 |
| ·Feature Server | 第27-29页 |
| ·Model Server | 第29页 |
| ·Stat Server | 第29-35页 |
| ·本章小结 | 第35-36页 |
| 第3章 Sonar v2平台设计和实现 | 第36-54页 |
| ·系统流程描述 | 第36-37页 |
| ·系统架构设计 | 第37-38页 |
| ·系统文件格式定义 | 第38-41页 |
| ·特色批量处理系统设计 | 第41-44页 |
| ·核心模块设计 | 第44-52页 |
| ·通用构件模块 | 第45-48页 |
| ·音频获取模块 | 第48页 |
| ·特征模块 | 第48-49页 |
| ·模型模块 | 第49-50页 |
| ·评测模块 | 第50-52页 |
| ·Sonar系统特点 | 第52-53页 |
| ·集成性 | 第52页 |
| ·封装性 | 第52页 |
| ·兼容性 | 第52-53页 |
| ·可剪裁性和可扩展性 | 第53页 |
| ·本章小结 | 第53-54页 |
| 第4章 Sonar v2的教学平台建设和系统推广 | 第54-71页 |
| ·教学平台建设 | 第54-66页 |
| ·入门篇──友好的用户界面 | 第54-56页 |
| ·提高篇──利用 API 进行二次开发 | 第56-60页 |
| ·演练篇──自动练习检查系统 | 第60-66页 |
| ·系统推广 | 第66-69页 |
| ·基于 Sonar v2的算法评测 | 第66-68页 |
| ·用户体验调查和系统改进 | 第68-69页 |
| ·本章小结 | 第69-71页 |
| 第5章 Sonar平台测试和性能分析 | 第71-82页 |
| ·代码级──功能单元测试 | 第71页 |
| ·平台级──准确性分析 | 第71-79页 |
| ·NIST 库评测性能分析 | 第72-74页 |
| ·YOHO 库评测性能分析 | 第74-77页 |
| ·Sonar v2 和 Alize的准确性比较 | 第77-79页 |
| ·系统级──运行开销分析 | 第79-81页 |
| ·空间效率分析 | 第79-81页 |
| ·时间效率分析 | 第81页 |
| ·本章小结 | 第81-82页 |
| 第6章 总结和展望 | 第82-84页 |
| 参考文献 | 第84-87页 |
| 攻读硕士学位期间主要的研究成果 | 第87-88页 |
| 致谢 | 第88-89页 |
| 附录一 《Sonar用户体验调查》 | 第89-92页 |