首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文--语音识别与设备论文

语音识别关键技术研究

摘要第5-6页
Abstract第6页
第一章 绪论第12-16页
    1.1 语音识别概述第12页
    1.2 语音识别的国内外发展现状第12-13页
    1.3 语音识别中的难点第13-14页
    1.4 课题背景及论文结构第14-16页
        1.4.1 课题背景第14页
        1.4.2 论文结构第14-16页
第二章 语音识别关键技术第16-43页
    2.1 语音识别系统总体框架第16页
    2.2 语音信号预处理第16-23页
        2.2.1 预滤波、采样、A/D变换第17页
        2.2.2 预处理第17-18页
        2.2.3 分帧加窗第18-19页
        2.2.4 时域分析、端点检测第19-23页
            2.2.4.1 短时能量分析第19-20页
            2.2.4.2 短时平均过零率分析第20-21页
            2.2.4.3 端点检测第21页
            2.2.4.4 双门限端点检测仿真及实现第21-23页
    2.3 语音信号的频域分析、特征参数提取第23-27页
        2.3.1 基音周期估计第23页
        2.3.2 共振峰的估计第23-24页
        2.3.3 线性预测倒谱系数LPCC第24-26页
        2.3.4 Mel频率倒谱系数MFCC第26-27页
    2.4 语音的训练与识别第27-42页
        2.4.1 动态时间规整(DTW)算法第27-33页
            2.4.1.1 DTW算法介绍第28-29页
            2.4.1.2 训练模板算法第29-30页
            2.4.1.3 DTW算法仿真及实现第30-33页
        2.4.2 隐马尔科夫模型(HMM)技术第33-42页
            2.4.2.1 HMM基本思想第33-35页
            2.4.2.2 HMM基本算法第35-40页
            2.4.2.3 HMM算法仿真及实现第40-42页
    2.5 本章小结第42-43页
第三章 Sphinx语音识别系统第43-58页
    3.1 Sphinx概述第43-44页
        3.1.1 Sphinx语音识别系统简介第43页
        3.1.2 Sphinx架构和主要模块介绍第43-44页
    3.2 基于SphinxTrain的声学模型训练第44-57页
        3.2.1 声学模型第44-45页
            3.2.1.1 声学模型概述第44页
            3.2.1.2 基本声学单元的选择第44-45页
            3.2.1.3 协同发音、三音子模型第45页
        3.2.2 声学模型的训练第45-57页
            3.2.2.1 矢量量化第47-48页
            3.2.2.2 训练CI模型第48-52页
            3.2.2.3 训练未聚类CD模型第52-54页
            3.2.2.4 决策树聚类第54-56页
            3.2.2.5 训练聚类CD模型第56页
            3.2.2.6 删除插值第56-57页
    3.3 本章小结第57-58页
第四章 汉语连续语音识别系统的构建和实现第58-71页
    4.1 汉语连续语音识别系统构建第58-65页
        4.1.1 语音库介绍第59页
        4.1.2 特征提取的改进第59-63页
        4.1.3 声学模型训练第63-64页
        4.1.4 实验环境及识别结果的计算第64-65页
    4.2 基于Sphinx的汉语连续数字串语音识别第65-68页
        4.2.1 语音库选择第65页
        4.2.2 数据准备第65-66页
        4.2.3 声学模型训练第66页
        4.2.4 实验结果及性能分析第66-68页
            4.2.4.1 改进MFCC提取算法对识别效果的影响第66-67页
            4.2.4.2 码本数对识别结果的影响第67页
            4.2.4.3 状态数对识别结果的影响第67-68页
    4.3 基于Sphinx的汉语连续语音识别第68-70页
        4.3.1 语音库选择第68页
        4.3.2 数据准备第68-69页
        4.3.3 实验结果及性能分析第69-70页
    4.4 本章小结第70-71页
第五章 总结与展望第71-72页
    5.1 本文总结第71页
    5.2 研究展望第71-72页
致谢第72-73页
参考文献第73-75页
攻读硕士学位期间取得的成果第75-76页

论文共76页,点击 下载论文
上一篇:基于Hadoop平台和Mahout框架的推荐系统研究与实现
下一篇:多元一体格局下的哈汉双语教育研究