网络环境下实时音频解码与鲁棒说话人识别系统研究
摘要 | 第1-5页 |
Abstract | 第5-9页 |
第1章 绪论 | 第9-18页 |
·研究目的和意义 | 第9-10页 |
·国内外研究现状 | 第10-16页 |
·网络环境下实时音频解码 | 第10-12页 |
·说话人识别的研究进展及主要方法 | 第12-14页 |
·网络环境下说话人识别的难点 | 第14-16页 |
·本文的研究内容 | 第16-18页 |
第2章 基于协处理器的实时音频解码分析与实现 | 第18-30页 |
·引言 | 第18-19页 |
·协处理器实现实时音频解码的必要性 | 第19-20页 |
·不同协处理器实时音频解码实现分析 | 第20-24页 |
·DSP 上实现分析 | 第20-21页 |
·FPGA 上实现分析 | 第21-22页 |
·GPU 上实现分析 | 第22-23页 |
·众核上实现分析 | 第23-24页 |
·众核在实时音频解码方面的优势 | 第24-26页 |
·基于众核的实时音频解码设计与实现 | 第26-28页 |
·实验与讨论 | 第28-29页 |
·本章小结 | 第29-30页 |
第3章 语音非语音分类及通用说话人识别系统 | 第30-43页 |
·引言 | 第30页 |
·语音非语音分类方法 | 第30-34页 |
·VAD | 第31页 |
·基于SVM 的语音非语音分类 | 第31-34页 |
·通用说话人识别系统 | 第34-37页 |
·基于GMM-UBM 的通用系统 | 第34-36页 |
·预处理及特征选取 | 第36-37页 |
·实验与讨论 | 第37-42页 |
·语音非语音方法实验与讨论 | 第37-39页 |
·语料库 | 第39-40页 |
·通用说话人识别系统实验与讨论 | 第40-42页 |
·本章小结 | 第42-43页 |
第4章 基于说话人确认的鲁棒提高方法 | 第43-56页 |
·引言 | 第43页 |
·基于高阶语义窗的确认方法 | 第43-46页 |
·高阶语义窗方法 | 第43-45页 |
·加速策略 | 第45-46页 |
·基于音素级对比的确认方法 | 第46-50页 |
·可行性分析 | 第46-49页 |
·音素级对比方法 | 第49-50页 |
·实验和讨论 | 第50-54页 |
·高阶语义窗 | 第51页 |
·音素级对比 | 第51-52页 |
·高阶语义窗与音素级对比方法融合 | 第52-53页 |
·实验分析和讨论 | 第53-54页 |
·本章小结 | 第54-56页 |
结论 | 第56-57页 |
参考文献 | 第57-63页 |
致谢 | 第63页 |