网络环境下实时音频解码与鲁棒说话人识别系统研究
| 摘要 | 第1-5页 |
| Abstract | 第5-9页 |
| 第1章 绪论 | 第9-18页 |
| ·研究目的和意义 | 第9-10页 |
| ·国内外研究现状 | 第10-16页 |
| ·网络环境下实时音频解码 | 第10-12页 |
| ·说话人识别的研究进展及主要方法 | 第12-14页 |
| ·网络环境下说话人识别的难点 | 第14-16页 |
| ·本文的研究内容 | 第16-18页 |
| 第2章 基于协处理器的实时音频解码分析与实现 | 第18-30页 |
| ·引言 | 第18-19页 |
| ·协处理器实现实时音频解码的必要性 | 第19-20页 |
| ·不同协处理器实时音频解码实现分析 | 第20-24页 |
| ·DSP 上实现分析 | 第20-21页 |
| ·FPGA 上实现分析 | 第21-22页 |
| ·GPU 上实现分析 | 第22-23页 |
| ·众核上实现分析 | 第23-24页 |
| ·众核在实时音频解码方面的优势 | 第24-26页 |
| ·基于众核的实时音频解码设计与实现 | 第26-28页 |
| ·实验与讨论 | 第28-29页 |
| ·本章小结 | 第29-30页 |
| 第3章 语音非语音分类及通用说话人识别系统 | 第30-43页 |
| ·引言 | 第30页 |
| ·语音非语音分类方法 | 第30-34页 |
| ·VAD | 第31页 |
| ·基于SVM 的语音非语音分类 | 第31-34页 |
| ·通用说话人识别系统 | 第34-37页 |
| ·基于GMM-UBM 的通用系统 | 第34-36页 |
| ·预处理及特征选取 | 第36-37页 |
| ·实验与讨论 | 第37-42页 |
| ·语音非语音方法实验与讨论 | 第37-39页 |
| ·语料库 | 第39-40页 |
| ·通用说话人识别系统实验与讨论 | 第40-42页 |
| ·本章小结 | 第42-43页 |
| 第4章 基于说话人确认的鲁棒提高方法 | 第43-56页 |
| ·引言 | 第43页 |
| ·基于高阶语义窗的确认方法 | 第43-46页 |
| ·高阶语义窗方法 | 第43-45页 |
| ·加速策略 | 第45-46页 |
| ·基于音素级对比的确认方法 | 第46-50页 |
| ·可行性分析 | 第46-49页 |
| ·音素级对比方法 | 第49-50页 |
| ·实验和讨论 | 第50-54页 |
| ·高阶语义窗 | 第51页 |
| ·音素级对比 | 第51-52页 |
| ·高阶语义窗与音素级对比方法融合 | 第52-53页 |
| ·实验分析和讨论 | 第53-54页 |
| ·本章小结 | 第54-56页 |
| 结论 | 第56-57页 |
| 参考文献 | 第57-63页 |
| 致谢 | 第63页 |