首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文

维吾尔语可视语音合成中声视同步和表情控制研究

摘要第3-4页
Abstract第4-5页
第1章 绪论第8-15页
    1.1 研究背景及意义第8-9页
    1.2 国内外研究现状及难点第9-14页
        1.2.1 研究现状第9-13页
        1.2.2 难点第13-14页
    1.3 章节及内容安排第14-15页
第2章 声视数据采集第15-19页
    2.1 研究目标、范围及方法的确定第15-16页
    2.2 文本语料的选取第16-17页
    2.3 音视频录制第17页
    2.4 数据质量保证第17-18页
    2.5 小结第18-19页
第3章 数据分析与处理第19-39页
    3.1 声学数据分析第19-34页
        3.1.1 情感区分性特征计算第20-33页
            3.1.1.1 能量分析第20-22页
            3.1.1.2 基频分析第22-24页
            3.1.1.3 共振峰分析第24-26页
            3.1.1.4 线性谱频率(LSF)分析第26-28页
            3.1.1.5 梅尔倒谱系数第28-31页
            3.1.1.6 感知线性预测倒谱系数 PLPCC第31-33页
        3.1.2 音素集建立第33-34页
    3.2 唇区数据处理第34-38页
        3.2.1 姿态矫正第34-36页
        3.2.2 维吾尔语唇区视位确定第36-37页
        3.2.3 维吾尔语情感视位确定第37-38页
    3.3 小结第38-39页
第4章 同步模型第39-46页
    4.1 同步模型基本思想第39页
    4.2 段间相似性模型第39-42页
    4.3 基于 HMM 的音素识别第42-45页
        4.3.1 HMM 模型基本理论第42-44页
        4.3.2 HMM 训练与识别第44-45页
    4.4 小结第45-46页
第5章 表情控制模型第46-57页
    5.1 表情控制模型基本思想第46页
    5.2 基本情感识别第46-53页
        5.2.1 常用情感识别方法第47-49页
        5.2.2 BP 神经网络(BPNN)理论第49-52页
        5.2.3 BPNN 的训练与识别第52-53页
    5.3 可视韵律表情调制模型第53-56页
    5.4 小结第56-57页
第6章 实验与评估第57-63页
    6.1 可视语音合成第57-58页
    6.2 主客观评估第58-63页
第7章 总结与展望第63-65页
    7.1 总结第63-64页
    7.2 展望第64-65页
参考文献第65-69页
致谢第69-71页
硕士期间发表的论文第71页

论文共71页,点击 下载论文
上一篇:基于日志的协同图像自动标注
下一篇:多跳协作分集系统性能研究