首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文--语音识别与设备论文

基于子空间的声学模型及自适应技术研究

摘要第4-6页
Abstract第6-7页
第一章 绪论第15-43页
    1.1 语音识别发展概述第15-17页
    1.2 语音识别基本原理第17-23页
        1.2.1 特征提取第18-19页
        1.2.2 发音字典第19页
        1.2.3 声学模型第19页
        1.2.4 语言模型第19-20页
        1.2.5 解码器第20-21页
        1.2.6 系统性能评价方法第21-23页
    1.3 HMM声学模型及其自适应技术研究现状第23-38页
        1.3.1 基于HMM的声学建模基本原理第23-28页
        1.3.2 基于HMM的声学模型研究现状第28-33页
        1.3.3 声学模型自适应技术研究现状第33-38页
    1.4 论文的研究意义及组织结构第38-43页
        1.4.1 论文的研究内容及其意义第38-40页
        1.4.2 论文的组织结构第40-43页
第二章 基于非线性流形结构的声学建模第43-69页
    2.1 声学特征空间非线性流形结构模型第43-50页
        2.1.1 基于MFA的非线性流形建模第43-46页
        2.1.2 语音特征空间MFA模型的训练方法第46-50页
    2.2 基于声学特征空间非线性流形结构的声学建模第50-52页
    2.3 模型参数的EM估计算法第52-57页
        2.3.1 权重矢量的迭代收缩估计算法第53-54页
        2.3.2 局部坐标矢量的重估算法第54-55页
        2.3.3 局部区域基矩阵的重估算法第55-56页
        2.3.4 局部区域均值矢量的重估算法第56-57页
        2.3.5 状态无关协方差矩阵的重估算法第57页
    2.4 与现有声学模型的比较第57-59页
        2.4.1 与一般典型状态模型的关系第57-58页
        2.4.2 与半连续隐马尔可夫模型的比较第58页
        2.4.3 与子空间高斯混合模型的比较第58-59页
        2.4.4 与贝叶斯感知隐马尔可夫模型的比较第59页
    2.5 实验结果与分析第59-67页
        2.5.1 基于RM语料库的实验第59-64页
        2.5.2 基于WSJ语料库的实验第64-67页
    2.6 本章小结第67-69页
第三章 非线性流形声学模型的区分性训练第69-83页
    3.1 提升最大互信息准则第69-70页
    3.2 基于MMI/BMMI准则的参数估计算法一般框架第70-72页
        3.2.1 弱辅助函数优化算法基本原理第70-71页
        3.2.2 MMI/BMMI目标函数的弱辅助函数优化算法第71-72页
        3.2.3 模型参数的MAP更新算法第72页
    3.3 MFA声学模型的区分性训练第72-77页
        3.3.1 权重矢量的区分性训练第72-73页
        3.3.2 局部坐标矢量的区分性训练第73-74页
        3.3.3 局部区域基矩阵的区分性训练第74-76页
        3.3.4 局部均值矢量的区分性训练第76页
        3.3.5 状态无关协方差矩阵的区分性训练第76-77页
    3.4 实验结果与分析第77-81页
        3.4.1 基于RM语料库的实验第77-80页
        3.4.2 基于WSJ语料库的实验第80-81页
    3.5 本章小结第81-83页
第四章 基于说话人子空间的自适应方法第83-105页
    4.1 基于说话人子空间的模型自适应框架第84-87页
        4.1.1 基本原理第84-85页
        4.1.2 现有方法的优缺点分析第85-87页
    4.2 压缩感知自适应原理及说话人字典的构造第87页
    4.3 基于匹配追踪的自适应方法第87-92页
        4.3.1 基本思想第88页
        4.3.2 序列最大似然基选取第88-89页
        4.3.3 说话人因子的快速更新算法第89-90页
        4.3.4 冗余超矢量的去除第90-91页
        4.3.5 算法终止策略第91-92页
        4.3.6 基于匹配追踪的说话人自适应方法流程第92页
    4.4 基于L1正则化的自适应方法第92-94页
        4.4.1 基于L1则化的自适应原理第93页
        4.4.2 目标函数的数学优化算法第93-94页
    4.5 实验结果及分析第94-104页
        4.5.1 基于微软中文语料库的批量自适应实验第95-101页
        4.5.2 基于WSJ语料库的即时自适应实验第101-104页
    4.6 本章小结第104-105页
第五章 基于音子变化子空间的自适应方法第105-127页
    5.1 音子变化子空间建模第105-109页
        5.1.1 音子变化子空间与本征音子第105-106页
        5.1.2 音子变化超矢量及其主分量分解第106-108页
        5.1.3 与说话人子空间的对比第108-109页
    5.2 基于本征音子估计的说话人自适应方法第109-114页
        5.2.1 扩展本征音子矩阵的最大似然估计第109-112页
        5.2.2 与其它说话人自适应方法的比较第112-114页
    5.3 基于音子变化子空间的说话人自适应训练方法第114-117页
        5.3.1 说话人自适应训练基本原理及训练流程第114-116页
        5.3.2 高斯混元坐标矢量的最大似然估计第116-117页
        5.3.3 基于稀疏约束的高斯混元坐标矢量估计第117页
    5.4 实验结果及分析第117-125页
        5.4.1 基于微软中文语料库的批量自适应实验第117-123页
        5.4.2 基于RM语料库的即时自适应实验第123-125页
    5.5 本章小结第125-127页
第六章 基于正则化本征音子估计的自适应方法第127-143页
    6.1 正则化本征音子矩阵估计的基本原理第127页
    6.2 常用正则化方法及其比较第127-130页
        6.2.1 L1则化方法第127-128页
        6.2.2 L2正则化方法第128页
        6.2.3 弹性网正则化方法第128-129页
        6.2.4 核范数正则化方法第129页
        6.2.5 组稀疏正则化方法第129-130页
        6.2.6 稀疏组LASSO正则化方法第130页
    6.3 数学优化方法第130-135页
        6.3.1 近点映射算子第131-133页
        6.3.2 加速的递增近点梯度算法原理及其流程第133-135页
    6.4 实验结果及分析第135-141页
        6.4.1 基于L1正则化的实验第135-136页
        6.4.2 基于L2则化的实验第136页
        6.4.3 基于弹性网正则化的实验第136-137页
        6.4.4 基于核范数正则化的实验第137-138页
        6.4.5 基于组稀疏正则化的实验第138-139页
        6.4.6 基于稀疏组LASSO的实验第139-141页
    6.5 本章小结第141-143页
第七章 层次化贝叶斯自适应方法第143-169页
    7.1 本征音子的子空间建模及其自适应方法第143-146页
        7.1.1 本征音子的说话人子空间模型第144页
        7.1.2 基于本征音子说话人子空间的自适应方法第144-146页
    7.2 高斯均值矢量的层次化概率模型第146-149页
        7.2.1 概率主分量分析简介第146-147页
        7.2.2 基于音子变化子空间的高斯均值矢量先验概率模型第147-148页
        7.2.3 基于说话人子空间的本征音子先验概率模型第148页
        7.2.4 高斯均值矢量的层次化先验概率模型第148-149页
    7.3 层次化贝叶斯说话人自适应方法第149-155页
        7.3.1 层化次贝叶斯说话人自适应框架第149-151页
        7.3.2 说话人坐标矢量的最大后验估计第151-152页
        7.3.3 扩展本征音子超矢量的最大后验估计第152-153页
        7.3.4 高斯均值矢量的最大后验估计第153-154页
        7.3.5 在线说话人自适应第154-155页
    7.4 层次化贝叶斯自适应的简化实现方法第155-158页
        7.4.1 简化的批量说话人自适应方法第156-157页
        7.4.2 简化的在线说话人自适应方法第157-158页
    7.5 实验结果及分析第158-168页
        7.5.1 基于微软语料库的实验第158-166页
        7.5.2 基于RM语料库的实验第166-168页
    7.6 本章小结第168-169页
第八章 总结第169-173页
    一、 论文工作总结第169-171页
    二、下一步研究工作的展望第171-173页
致谢第173-175页
参考文献第175-193页
作者简历第193-194页

论文共194页,点击 下载论文
上一篇:我国县域地质灾害防治规划研究--以河北省滦县为例
下一篇:多元化采购下的供应商管理研究--以A公司为例