摘要 | 第1-8页 |
ABSTRACT | 第8-12页 |
常用英文縮写对照表 | 第12-14页 |
目录 | 第14-18页 |
第一章 绪论 | 第18-28页 |
·引言 | 第18-19页 |
·发音质量自动评测研究回顾 | 第19-21页 |
·文本相关的评测技术概述 | 第21-24页 |
·自动语音识别模块 | 第21-23页 |
·发音质量评测模块 | 第23-24页 |
·论文研究目标及内容安排 | 第24-28页 |
第二章 基于统计模式识别的发音质量自动评测系统简介 | 第28-50页 |
·引言 | 第28页 |
·HMM在发音质量评测中的应用 | 第28-38页 |
·HMM简介 | 第29-30页 |
·发音质量评测中的HMM | 第30-37页 |
·常用于HMM建模的观测矢量 | 第37-38页 |
·文本相关的发音质量自动评测系统 | 第38-46页 |
·系统结构 | 第38页 |
·文本相关发音质量评测中的语音识别 | 第38-41页 |
·评分特征的提取 | 第41-45页 |
·评分模型介绍及机器分的计算 | 第45-46页 |
·基线系统 | 第46-49页 |
·实验配置 | 第46-48页 |
·基线系统性能 | 第48-49页 |
·本章小结 | 第49-50页 |
第三章 音素相关的后验概率变换 | 第50-64页 |
·引言 | 第50-51页 |
·后验概率算法的缺陷 | 第51-54页 |
·不同音素后验概率测度不一致 | 第51-53页 |
·忽略了评分标准 | 第53-54页 |
·改进的后验概率算法 | 第54-55页 |
·基于典型发音错误概率空间的后验概率 | 第54-55页 |
·基于KLD差的概率空间的后验概率 | 第55页 |
·音素相关的可训练的后验概率变换算法 | 第55-60页 |
·定义 | 第56页 |
·线性变换 | 第56-57页 |
·非线性sigmoid变换 | 第57-60页 |
·实验及结论 | 第60-62页 |
·全音素概率空间的实验结果 | 第60-61页 |
·优化的概率空间的实验结果 | 第61-62页 |
·本章小结 | 第62-64页 |
第四章 针对发音质量评测的声学模型训练 | 第64-90页 |
·引言 | 第64-65页 |
·采用ASR建模方法的缺陷及目前的改进策略 | 第65-66页 |
·ASR中的区分性训练介绍及其在CALL系统中的应用 | 第66-72页 |
·ASR中的区分性训练简介 | 第66-70页 |
·发音错误检测中的声学模型区分性训练 | 第70-72页 |
·区分性声学模型在发音质量评测中的应用 | 第72页 |
·针对发音质量评测的声学模型训练 | 第72-81页 |
·数据库表示 | 第73页 |
·优化目标----最小化训练集机器分与人工分均方误差 | 第73-74页 |
·声学模型的参数优化 | 第74-78页 |
·针对发音质量评测的词图及高斯后验概率的计算 | 第78-80页 |
·评测声学模型的训练步骤及在CALL系统中的应用 | 第80-81页 |
·针对发音质量评测的声学模型训练与区分性训练的比较 | 第81-85页 |
·不同之处 | 第81-84页 |
·相同之处 | 第84-85页 |
·与ASR中区分性训练的异同小结 | 第85页 |
·实验和结论 | 第85-88页 |
·以MLE和MPE为初始声学模型的实验 | 第86-87页 |
·不同概率空间的实验 | 第87-88页 |
·基于音素相关后验概率变换的评测声学模型训练 | 第88页 |
·本章小结 | 第88-90页 |
第五章 基于评测性映射变换的无监督声学模型自适应 | 第90-114页 |
·引言 | 第90-93页 |
·发音质量评测系统中的声学模型自适应介绍 | 第93-98页 |
·发音质量评测中的MLLR | 第94-98页 |
·发音质量评测中的MAP介绍 | 第98页 |
·评测性映射变换矩阵的训练 | 第98-106页 |
·训练目标——最小化机器分与人工分均方误差 | 第99-100页 |
·EMT的训练算法 | 第100-106页 |
·EMT和DMT及针对发音质量评测的声学建模的比较 | 第106-108页 |
·EMT与DMT的异同 | 第106-107页 |
·EMT与针对发音质量评测的声学建模的比较 | 第107-108页 |
·实验及结论 | 第108-112页 |
·说话人自适应配置 | 第108-109页 |
·实验结果 | 第109-112页 |
·本章小结 | 第112-114页 |
第六章 系统相关的评测性映射变换的训练及统一框架 | 第114-138页 |
·引言 | 第114-116页 |
·EMT训练的统一框架 | 第116-122页 |
·优化目标——最小化损失函数 | 第116页 |
·优化算法——EB算法 | 第116-119页 |
·EMT训练统一框架的实现 | 第119-120页 |
·音素斜率的物理意义及典型系统的音素斜率求解 | 第120-122页 |
·EMT训练统一框架与区分性训练统一框架比较 | 第122-123页 |
·EMT训练统一框架在PSC自动评分系统中的应用 | 第123-130页 |
·针对普通话水平测试的优化目标 | 第123-124页 |
·PSC自动评分系统的评分算法 | 第124-125页 |
·多维后验概率策略 | 第125-126页 |
·音素相关后验概率变换在PSC中的应用 | 第126-128页 |
·融入PSC自动评分系统的EMT训练小结 | 第128-130页 |
·实验及结论 | 第130-136页 |
·分类回归策略的详细配置 | 第130-132页 |
·基线系统介绍及基线系统性能 | 第132页 |
·EMT训练的统一框架实验 | 第132-136页 |
·本章小结 | 第136-138页 |
第七章 论文工作总结及展望 | 第138-142页 |
·论文工作总结 | 第138-139页 |
·工作展望 | 第139-142页 |
参考文献 | 第142-152页 |
个人研究经历及博士课题相关论文 | 第152-154页 |
致谢 | 第154页 |