摘要 | 第4-5页 |
Abstract | 第5页 |
专用术语注释表 | 第8-9页 |
第1章 绪论 | 第9-20页 |
1.1 研究动机 | 第9-10页 |
1.2 语音的感知 | 第10-12页 |
1.2.1 语音的声学特征 | 第10-11页 |
1.2.2 语音的感知实验 | 第11-12页 |
1.3 文献探讨 | 第12-18页 |
1.3.1 听觉感知研究的回顾 | 第12-15页 |
1.3.2 语音的感知模型回顾 | 第15-16页 |
1.3.3 DIVA 模型 | 第16-18页 |
1.4 研究目的 | 第18页 |
1.5 论文架构 | 第18-20页 |
第2章 神经网络基本理论 | 第20-29页 |
2.1 神经网络的简介 | 第20-22页 |
2.1.1 神经元模型 | 第20-21页 |
2.1.2 神经网络架构 | 第21-22页 |
2.1.3 神经网络的类型 | 第22页 |
2.2 学习机制 | 第22-25页 |
2.2.1 监督式学习 | 第22-23页 |
2.2.2 非监督式学习 | 第23-25页 |
2.3 自组织特征映射网络 | 第25-27页 |
2.4 模式识别 | 第27-28页 |
2.5 本章小结 | 第28-29页 |
第3章 语音感知模型 | 第29-38页 |
3.1 语音的感知模型 | 第29-33页 |
3.1.1 模型架构 | 第29页 |
3.1.2 共振峰的表示 | 第29-30页 |
3.1.3 听觉映射集 | 第30-31页 |
3.1.4 群向量(population vector) | 第31页 |
3.1.5 听觉感知模型结合 SOM 网络的运用 | 第31-32页 |
3.1.6 语音的产生 | 第32-33页 |
3.2 DIVA 模型 | 第33-37页 |
3.2.1 DIVA 模型的发音流程 | 第34页 |
3.2.2 语音映射集(Speech Sound Map) | 第34-35页 |
3.2.3 体觉方向向量(Orosensory Direction Vector) | 第35-36页 |
3.2.4 发音器官的运动向量(Articulator Velocity Vector) | 第36-37页 |
3.2.5 听觉反馈系统 | 第37页 |
3.2.6 语音处理程序 | 第37页 |
3.3 本章小结 | 第37-38页 |
第4章 实验与方法 | 第38-48页 |
4.1 实验方法 | 第38-39页 |
4.2 模拟实验 | 第39-43页 |
4.2.1 英文辅音/r/和/l/的辨认 | 第39-41页 |
4.2.2 典型音与非典型音的实验 | 第41-42页 |
4.2.3 训练听觉感知空间 | 第42-43页 |
4.3 利用 DIVA 模型模拟语音感知 | 第43-47页 |
4.3.1 DIVA 模型的接口 | 第43-46页 |
4.3.2 增加听觉感知至 DIVA 模型 | 第46-47页 |
4.4 本章小结 | 第47-48页 |
第5章 结果与讨论 | 第48-64页 |
5.1 模拟结果 | 第48-53页 |
5.1.1 英文辅音/r/-/l/的辨认 | 第48-51页 |
5.1.2 典型音与非典型音的辨认差异 | 第51-52页 |
5.1.3 听觉感知空间的训练 | 第52-53页 |
5.2 DIVA 模型的听觉感知空间 | 第53-63页 |
5.2.1 语音感知与语音产生 | 第54-56页 |
5.2.2 语音感知与语音产生间的关系 | 第56-59页 |
5.2.3 语音感知的衍生讨论——汉语元音 | 第59-61页 |
5.2.4 利用实际人声训练中文元音 | 第61-63页 |
5.3 语音感知模型与神经生理学上的关系 | 第63-64页 |
第6章 结论与展望 | 第64-66页 |
6.1 结论 | 第64页 |
6.2 展望 | 第64-66页 |
参考文献 | 第66-69页 |
附录 1 程序清单 | 第69-70页 |
附录 2 攻读硕士学位期间撰写的论文 | 第70-71页 |
附录 3 攻读硕士学位期间申请的专利 | 第71-72页 |
附录 4 攻读硕士学位期间参加的科研项目 | 第72-73页 |
致谢 | 第73页 |