摘要 | 第1-7页 |
Abstract | 第7-14页 |
插图索引 | 第14-17页 |
附表索引 | 第17-18页 |
第1章 绪论 | 第18-27页 |
·研究目的与意义 | 第18-19页 |
·嵌入式自动语音识别概述 | 第19-23页 |
·嵌入式语音识别系统 | 第19-20页 |
·语音用户界面 | 第20-22页 |
·现行研究存在的问题 | 第22-23页 |
·研究内容与创新点 | 第23-24页 |
·研究内容 | 第23-24页 |
·创新点 | 第24页 |
·论文组织结构 | 第24-27页 |
第2章 相关基础理论与研究综述 | 第27-53页 |
·自动语音识别技术发展及研究综述 | 第27-31页 |
·自动语音识别研究综述 | 第27-29页 |
·自动语音识别技术发展现状 | 第29-31页 |
·鲁棒语音识别研究综述 | 第31-35页 |
·信号空间鲁棒语音识别技术 | 第32-33页 |
·特征空间鲁棒语音识别技术 | 第33-34页 |
·模型空间鲁棒语音识别技术 | 第34页 |
·其他鲁棒语音识别技术 | 第34-35页 |
·面向嵌入式系统的语音识别 | 第35-37页 |
·嵌入式平台应用的约束条件 | 第35-37页 |
·嵌入式语音识别研究应用现状 | 第37页 |
·自动语音识别理论基础 | 第37-44页 |
·语音信号生成的数学模型 | 第37-40页 |
·统计模式识别方法 | 第40-41页 |
·隐马尔科夫模型 | 第41-44页 |
·语音信号短时分析技术 | 第44-48页 |
·语音信号的时域分析 | 第44-47页 |
·语音信号的频域分析 | 第47-48页 |
·语音识别系统组成 | 第48-52页 |
·语音识别系统分类 | 第48-49页 |
·基于模式识别方法的语音识别系统 | 第49-50页 |
·自动语音识别系统 | 第50-52页 |
·小结 | 第52-53页 |
第3章 语音端点检测的两种新方法 | 第53-76页 |
·语音端点检测过程 | 第53-58页 |
·语音端点检测主要步骤 | 第53页 |
·语音信号的预处理 | 第53-56页 |
·语音端点检测中的门限 | 第56-58页 |
·语音端点检测方法综述 | 第58-60页 |
·时域端点检测 | 第58页 |
·频域端点检测 | 第58-59页 |
·非线性特征端点检测 | 第59-60页 |
·各种特征参数相结合的端点检测 | 第60页 |
·基于对数能量谱熵的语音端点检测方法 | 第60-68页 |
·对数能量谱熵特征 | 第61-63页 |
·门限估计与端点检测 | 第63-65页 |
·仿真实验与分析 | 第65-67页 |
·算法时间复杂度分析 | 第67-68页 |
·基于样本熵的语音端点检测方法 | 第68-75页 |
·样本熵用于语音端点检测的可行性 | 第68-70页 |
·样本熵特征的计算 | 第70-71页 |
·门限估计与端点检测 | 第71-72页 |
·仿真实验与分析 | 第72-75页 |
·算法时间复杂度分析 | 第75页 |
·小结 | 第75-76页 |
第4章 基于Bark域的改进RL语音增强方法 | 第76-94页 |
·语音增强方法综述 | 第76-79页 |
·基于短时谱估计 | 第76-78页 |
·基于语音生成模型 | 第78-79页 |
·基于人耳听觉掩蔽效应 | 第79页 |
·人耳听觉感知系统及其掩蔽效应 | 第79-82页 |
·人的听觉系统 | 第79-80页 |
·人耳的听觉特性 | 第80-82页 |
·基于Bark域的噪声谱估计及掩蔽效应语音增强 | 第82-89页 |
·谱减法语音增强及Bark域 | 第82-84页 |
·基于Bark域的噪声谱估计 | 第84-86页 |
·基于Bark域的谱减 | 第86-88页 |
·改进的语音增强算法 | 第88-89页 |
·改进的语音增强算法性能评估 | 第89-92页 |
·仿真实验及分析 | 第89-90页 |
·语音增强效果的评估 | 第90-92页 |
·小结 | 第92-94页 |
第5章 基于子带频谱质心的改进MFCC语音特征提取 | 第94-112页 |
·语音特征参数 | 第94-95页 |
·LPC特征及其改进 | 第94页 |
·MFCC特征及其改进 | 第94-95页 |
·MFCC特征提取 | 第95-99页 |
·Mel频率简介 | 第95-96页 |
·MFCC标准提取过程 | 第96-99页 |
·MFCC参数的选取 | 第99页 |
·改进的MFCC特征提取 | 第99-111页 |
·汉明窗系数的调整 | 第99-101页 |
·子带频谱质心的研究 | 第101-103页 |
·仿真实验与分析 | 第103-111页 |
·小结 | 第111-112页 |
第6章 ASR前端系统在DSP上的优化与移植 | 第112-134页 |
·Blackfin DSP平台介绍 | 第112-118页 |
·ADSP-BF533的内核结构 | 第113-114页 |
·串行外设 | 第114-115页 |
·ADSP-BF533的DMA及中断 | 第115-116页 |
·ADSP-BF533的锁相环和时钟控制 | 第116页 |
·AD1836A音频编解码器 | 第116-117页 |
·Blackfin DSP软件开发环境 | 第117-118页 |
·基于ADSP-BF533的语音识别前端系统总体结构 | 第118-126页 |
·系统硬件框架 | 第118-119页 |
·系统软件结构 | 第119-123页 |
·语音数据的采集和处理 | 第123-126页 |
·语音识别前端处理算法的优化策略 | 第126-129页 |
·任务的控制方式 | 第127-128页 |
·基于Blackfin DSP的优化技术 | 第128-129页 |
·语音识别前端处理算法的移植 | 第129-133页 |
·链接Blackfin处理器 | 第129-131页 |
·系统的资源管理 | 第131-133页 |
·小结 | 第133-134页 |
第7章 移动学习平台应用系统的设计与实现 | 第134-150页 |
·移动学习平台系统功能和总体结构 | 第134-136页 |
·移动学习平台系统结构 | 第134-135页 |
·移动学习平台实现的功能 | 第135-136页 |
·移动学习平台关键技术 | 第136-141页 |
·教学资源的知识表示 | 第136-138页 |
·多样化的人机交互界面 | 第138页 |
·移动学习终端 | 第138-141页 |
·教学资源编/解码方案以及实时流媒体传输 | 第141-146页 |
·视频编码方式 | 第141-142页 |
·音频编码方式 | 第142-146页 |
·读书郎移动学习平台系列产品 | 第146-149页 |
·儿童早教机系列 | 第146-147页 |
·学生掌上电脑系列 | 第147-148页 |
·全学科数码读书机系列 | 第148-149页 |
·小结 | 第149-150页 |
结论 | 第150-152页 |
参考文献 | 第152-164页 |
致谢 | 第164-165页 |
附录A 攻读学位期间发表的相关学术论文 | 第165-167页 |
附录B 攻读学位期间参与的科研工作 | 第167页 |