摘要 | 第1-3页 |
Abstract | 第3-4页 |
目录 | 第4-6页 |
第一章 引言 | 第6-13页 |
·IPCC项目背景 | 第6-8页 |
·呼叫中心的定义 | 第6-7页 |
·呼叫中心的发展历程 | 第7-8页 |
·IPCC项目的工作以及研究重点 | 第8-9页 |
·IPCC项目的总体架构 | 第9-10页 |
·功能模块结构 | 第10-12页 |
·论文的组织结构 | 第12-13页 |
第二章 基于语音识别的IVR系统的总体设计 | 第13-16页 |
·系统的设计目标 | 第13-14页 |
·IVR的简介 | 第13-14页 |
·基于语音识别的IVR | 第14页 |
·系统的总体结构 | 第14-16页 |
·系统的总体结构图 | 第15页 |
·各个模块的定义 | 第15-16页 |
第三章 语音识别的基本理论 | 第16-24页 |
·语音识别系统的基本流程 | 第16-17页 |
·语音信号的预处理 | 第17-18页 |
·增益控制、预滤波、模/数(A/D)转换 | 第17页 |
·预加重 | 第17-18页 |
·加窗 | 第18页 |
·语音信号的特征参数提取 | 第18-21页 |
·语音信号的时域特征 | 第18-19页 |
·语音信号的频域特征 | 第19-21页 |
·基于线性预测的倒谱系数(LPCC) | 第19-20页 |
·基于 Mel频率的倒谱系数(MFCC) | 第20-21页 |
·语音的训练与识别 | 第21-24页 |
·动态时间归整(DTW) | 第21-22页 |
·隐马尔科夫模型(HMM) | 第22-23页 |
·神经网络模型(ANN) | 第23-24页 |
第四章 基于VoiceXML的语音交互界面的设计与实现 | 第24-36页 |
·VoiceXML语言以及由来 | 第24-25页 |
·传统 IVR系统的缺点 | 第25页 |
·VoiceXML的技术特点和优势 | 第25-26页 |
·VoiceXML的系统结构以及各个组件 | 第26-27页 |
·基于 VoiceXML的语音交互界面的设计与实现 | 第27-34页 |
·系统总体流程设计 | 第27-29页 |
·voiceXML代码设计 | 第29-32页 |
·Servlet的调用 | 第32-34页 |
·系统总体测试 | 第34-36页 |
第五章 基于二次识别的语音识别服务器的设计与实现 | 第36-48页 |
·设计的思想和基本原理 | 第36-39页 |
·提取特征 | 第39-40页 |
·wav文件格式 | 第39-40页 |
·提取 MFCC特征 | 第40页 |
·距离比较 | 第40-46页 |
·DTW算法 | 第41-44页 |
·算法原理 | 第41-42页 |
·路径搜索 | 第42-43页 |
·识别结果判定 | 第43-44页 |
·使用 DTW算法计算距离 | 第44-46页 |
·识别率实验 | 第46-48页 |
第六章 基于HMM的语音识别服务器的设计与实现 | 第48-65页 |
·隐马尔可夫模型 | 第48-50页 |
·Markov链 | 第48-49页 |
·隐马尔可夫模型 | 第49-50页 |
·可以使用隐马尔可夫模型来描述语音识别过程的原因 | 第50-51页 |
·用隐马尔可夫模型建立语音识别服务器使用的主要算法 | 第51-56页 |
·模型训练过程 | 第51-55页 |
·前向概率和后向概率 | 第51-53页 |
·使用 Baum-Welch算法解决训练模型问题 | 第53-55页 |
·语音识别过程 | 第55-56页 |
·HMM模型的实现 | 第56-62页 |
·特征参数mfcc与 lpcc的比较以及选取 | 第56-57页 |
·HMM状态转移图的选择 | 第57-59页 |
·HMM状态的个数选择 | 第59-60页 |
·参数选取结果 | 第60页 |
·模型训练 | 第60-61页 |
·语音识别 | 第61-62页 |
·识别率实验 | 第62页 |
·两种方法建立语音识别服务器的优缺点的比较 | 第62-65页 |
第七章 总结与展望 | 第65-67页 |
·本文工作的总结 | 第65-66页 |
·未来工作的展望 | 第66-67页 |
参考文献 | 第67-69页 |
致谢 | 第69页 |