致谢 | 第1-6页 |
中文摘要 | 第6-7页 |
ABSTRACT | 第7-9页 |
序 | 第9-14页 |
1 引言 | 第14-24页 |
·选题背景与意义 | 第14-16页 |
·语音识别与评测技术的发展与现状 | 第16-21页 |
·语音识别 | 第16-18页 |
·语音评测 | 第18-20页 |
·存在问题与挑战 | 第20-21页 |
·本论文的研究内容与结构 | 第21-24页 |
·研究内容 | 第21-22页 |
·论文的结构组成 | 第22-24页 |
2 语音语料库的建立 | 第24-30页 |
·语音语料库概述 | 第24-26页 |
·语音语料库建立、收集和标注的意义 | 第24页 |
·语音语料库的建立和收集要点 | 第24-25页 |
·标准语音库语音特征描述 | 第25-26页 |
·语音语料库的设计与建立 | 第26-30页 |
·语料库设计原则 | 第26-27页 |
·发音评测语音语料库的建立 | 第27-28页 |
·语音库的标注 | 第28-30页 |
3 汉语语音识别 | 第30-54页 |
·特征提取 | 第30-32页 |
·MFCC参量的计算流程 | 第30-31页 |
·语音参量计算的预处理 | 第31页 |
·语音参量计算的后处理 | 第31-32页 |
·差分倒谱参量 | 第32页 |
·隐马尔可夫模型(HMM) | 第32-40页 |
·隐马尔可夫模型概述 | 第33页 |
·语音识别中的HMM | 第33-34页 |
·HMM的结构和3个基本问题 | 第34-35页 |
·HMM输出概率计算 | 第35页 |
·HMM模型的前向概率和后向概率(评价问题) | 第35-36页 |
·利用前向概率和后向概率计算输出概率 | 第36页 |
·识别算法——Viterbi算法 | 第36-38页 |
·HMM参量训练的Baum-Welch算法(学习问题) | 第38-39页 |
·多观察序列的训练算法 | 第39-40页 |
·孤立词识别 | 第40-42页 |
·基于HMM模型的孤立词识别 | 第41页 |
·HMM模型参数训练——分段K均值算法 | 第41-42页 |
·连续语音识别 | 第42-50页 |
·声学模型 | 第44页 |
·语音识别单元的选取 | 第44-46页 |
·基于子词单元HMM训练 | 第46-47页 |
·连续语音识别中的搜索策略 | 第47-50页 |
·语音识别实验及结果分析 | 第50-54页 |
·声韵母建模 | 第50-51页 |
·MFCC系数 | 第51页 |
·HMM参数的确定 | 第51-52页 |
·HMM | 第52-54页 |
4 汉语声调识别 | 第54-88页 |
·汉语声调识别模块的总体设计 | 第54页 |
·音节切分 | 第54-57页 |
·静音分段 | 第54-55页 |
·阈值分段 | 第55页 |
·转折分段 | 第55-56页 |
·聚类分段 | 第56-57页 |
·基频提取 | 第57-60页 |
·三电平中心削波 | 第57-58页 |
·自相关法和平均幅度差法结合提取基音周期 | 第58-59页 |
·算法实现步骤 | 第59-60页 |
·插值平均 | 第60页 |
·汉语声调模式分析 | 第60-64页 |
·音联与协同发音 | 第62页 |
·声调模式分析 | 第62-63页 |
·变调规则 | 第63页 |
·汉语连续语音的声调识别 | 第63-64页 |
·动态时间归整 | 第64-68页 |
·动态规划技术(DP) | 第64-67页 |
·DTW算法的改进 | 第67-68页 |
·人工神经网络 | 第68-82页 |
·人工神经元 | 第68-70页 |
·人工神经元网络模型 | 第70页 |
·人工神经元网络的学习过程 | 第70-71页 |
·人工神经元网络的学习规则 | 第71-72页 |
·Delta学习规则 | 第72-73页 |
·多层网络的误差逆传播校正方法 | 第73-76页 |
·BP网络的学习规则与计算方法 | 第76-79页 |
·BP网络的设计分析 | 第79-82页 |
·汉语声调识别 | 第82-86页 |
·时间归整网络结构 | 第83-84页 |
·基于改进的BP网络算法实现 | 第84-86页 |
·声调识别的实验及结果分析 | 第86-88页 |
·基频提取 | 第86-87页 |
·声调识别 | 第87-88页 |
5 汉语语音总体评测 | 第88-106页 |
·汉语语音评测模块的总体设计 | 第88页 |
·发音确认——语音置信度评测 | 第88-95页 |
·统计假设检验 | 第89-91页 |
·生成HMMs和接收HMMs | 第91-93页 |
·置信测度 | 第93-94页 |
·性能评价 | 第94-95页 |
·时间对齐 | 第95-98页 |
·端点检测 | 第95-98页 |
·时间对齐——Viterbi最优状态序列搜索算法 | 第98页 |
·机器评分指标 | 第98-102页 |
·模板匹配 | 第102-103页 |
·评分机制及实验结果 | 第103-106页 |
6 系统设计与在汉语学习中的应用实现 | 第106-116页 |
·系统总体设计方案 | 第106-109页 |
·基于语音识别的发音评测技术 | 第106-107页 |
·系统总体架构设计 | 第107-109页 |
·系统架构方案 | 第109-110页 |
·系统整体界面层级结构 | 第109页 |
·数据处理封装性结构 | 第109-110页 |
·系统开发工具及策略选取 | 第110页 |
·系统实现 | 第110-116页 |
·软件系统实现 | 第111页 |
·远程学习系统网站建设 | 第111-116页 |
7 结论 | 第116-118页 |
参考文献 | 第118-126页 |
作者简历 | 第126-130页 |
学位论文数据集 | 第130页 |