首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

语音Corpus的自动构建和语音最小化标注的研究

摘要第7-9页
Abstract第9-11页
目录第12-15页
1 引言第15-24页
    1.1 研究背景和意义第15-18页
        1.1.1 传统方法简介第15-16页
        1.1.2 国内外研究现状第16-17页
        1.1.3 研究问题提出第17-18页
    1.2 语音识别和语音合成概述(国内外研究现状)第18-20页
        1.2.1 语音识别第18-19页
        1.2.2 语音合成第19-20页
    1.3 本文的主要研究内容和问题第20-22页
        1.3.1 研究内容第20-21页
        1.3.2 主要研究问题第21-22页
    1.4 本文的组织结构第22-24页
2 基础知识原理介绍第24-29页
    2.1 HMM 模型第24-26页
        2.1.1 隐马尔可夫模型定义第24-25页
        2.1.2 主要问题第25-26页
    2.2 HMM 基本算法第26-28页
        2.2.1 前向-后向算法(评估问题)第26-27页
        2.2.2 Viterbi 算法第27页
        2.2.3 Baum-Welch 算法第27-28页
    2.3 本章小结第28-29页
3 长篇幅多段落语音全自动切分算法第29-52页
    3.1 基于频谱参数的 HMM 和韵律参数的句子自动切分算法第29-32页
        3.1.1 全自动句子切分算法简介第29-30页
        3.1.2 HashMap Tracer 机制第30-31页
        3.1.3 最大化精确全自动标注算法的现实可行性第31-32页
    3.2 基于频谱参数的 HMM 的无标注的句子自动切分算法(ZLSS)第32-35页
        3.2.1 ZLSS 算法的切分原理介绍第32页
        3.2.2 检查机制第32-33页
        3.2.3 自动切分的迭代算法第33-35页
    3.3 基于半监督学习的句子切分算法第35-40页
        3.3.1 句子切分算法原理第35页
        3.3.2 V/C/P 分类技术第35-37页
        3.3.3 特征提取第37页
        3.3.4 检错机制第37-38页
        3.3.5 基于 Co_training 的极小化标注句子切分算法第38-40页
    3.4 实验结果及数据分析第40-45页
        3.4.1 实验数据及结果分析第40-41页
        3.4.2 HAZ-SAS 系统性能评估及实验分析第41-45页
    3.5 面向语音合成的音素切分方法第45-51页
        3.5.1 音素切分(Phoneme Segmentation)第45页
        3.5.2 基于 SPHINX 和 HTK 的 Phoneme-Alignment 技术第45-46页
        3.5.3 基于 Trainable TTS 的语音合成第46-49页
        3.5.4 实验结果和评估第49-51页
    3.6 本章小结第51-52页
4 基于 GoogleVoice 的文语自动对齐技术第52-62页
    4.1 识别引擎的介绍第52页
    4.2 文语自动对齐技术提出第52-58页
        4.2.1 强制对齐(识别-原始)第52-55页
        4.2.2 自动抽取算法第55-56页
        4.2.3 重校准算法的实现第56-58页
    4.3 音节检测机制第58-60页
        4.3.1 基于韵律参数的 Syllable/Pause(S/P)检测算法第58-59页
        4.3.2 基于 PRAAT 工具的音节检测第59-60页
        4.3.3 算法检测结果对照第60页
    4.4 用连续语流加强识别器和试验结果分析第60-61页
    4.5 本章小结第61-62页
5 基于声韵拼接的中文孤立词识别系统第62-76页
    5.1 声韵母基元定义第62页
    5.2 特定词语音识别语音库设计第62-66页
        5.2.1 语音数据库的设计第63页
        5.2.2 任务语法与词典的设计第63-65页
        5.2.3 系统建模的流程第65-66页
    5.3 基于决策树的问题集设计第66-67页
    5.4 模型训练第67-68页
        5.4.1 创建单音素 HMM 模型第67-68页
        5.4.2 绑定状态的三音素 HMM 模型第68页
    5.5 基于 Triphone 模型的自动拼词识别第68-69页
        5.5.1 原理介绍第68页
        5.5.2 具体实现第68-69页
    5.6 HTK 上实现 Downsampling第69-71页
        5.6.1 原理介绍第69-70页
        5.6.2 实现方法第70-71页
    5.7 倒谱均值正则化算法(CMN)第71-73页
    5.8 实验结果第73-75页
    5.9 本章小结第75-76页
6 总结和展望第76-78页
    6.1 全文工作总结第76-77页
    6.2 展望第77-78页
        6.2.1 文语对齐技术尚存在的问题第77页
        6.2.2 未来工作安排规划第77-78页
参考文献第78-83页
致谢第83-84页
个人简历第84页
硕士研究生期间发表的学术论文第84页
科研成果第84-85页

论文共85页,点击 下载论文
上一篇:持续集成在现代企业软件开发中的研究与实现
下一篇:基于扩展DPWS的数字家庭能源管理系统的研究