基于韵律和词汇信息的中英文句边界检测研究
摘要 | 第4-5页 |
abstract | 第5-6页 |
1 绪论 | 第10-18页 |
1.1 课题来源与研究意义 | 第10-11页 |
1.2 句边界检测的研究现状 | 第11-14页 |
1.3 本文主要工作及创新点 | 第14-16页 |
1.4 本文组织结构 | 第16-18页 |
2 语料库及评测标准 | 第18-22页 |
2.1 语料库 | 第18-19页 |
2.1.1 中文广播新闻语料库 | 第18-19页 |
2.1.2 英文广播新闻语料库 | 第19页 |
2.2 评测标准 | 第19-22页 |
3 句边界检测特征研究 | 第22-30页 |
3.1 韵律特征 | 第22-26页 |
3.1.1 停顿时长特征 | 第22-23页 |
3.1.2 基频特征 | 第23-25页 |
3.1.3 能量特征 | 第25-26页 |
3.1.4 词和音素时长特征 | 第26页 |
3.1.5 说话人转换特征 | 第26页 |
3.2 词汇特征 | 第26-28页 |
3.2.1 N-grams特征 | 第26-27页 |
3.2.2 POS和Chunk特征 | 第27页 |
3.2.3 词向量特征 | 第27-28页 |
3.3 本章小结 | 第28-30页 |
4 基于条件随机场的句边界检测 | 第30-44页 |
4.1 条件随机场模型 | 第30-37页 |
4.1.1 模型定义 | 第30-33页 |
4.1.2 概率计算问题 | 第33-34页 |
4.1.3 模型学习问题 | 第34-36页 |
4.1.4 序列预测问题 | 第36-37页 |
4.2 句边界检测系统概述 | 第37-38页 |
4.3 实验与分析 | 第38-41页 |
4.3.1 实验设置 | 第38-39页 |
4.3.2 实验结果与分析 | 第39-40页 |
4.3.3 特征使用分析 | 第40-41页 |
4.4 本章小结 | 第41-44页 |
5 基于DNN-CRF的句边界检测 | 第44-54页 |
5.1 深度神经网络模型 | 第44-48页 |
5.1.1 前向传播 | 第45-47页 |
5.1.2 后向传播 | 第47-48页 |
5.2 DNN-CRF句边界检测系统 | 第48-49页 |
5.3 实验与分析 | 第49-52页 |
5.3.1 实验设置 | 第49-50页 |
5.3.2 DNN韵律模型的结果与分析 | 第50-51页 |
5.3.3 DNN-CRF的结果与分析 | 第51-52页 |
5.4 本章小结 | 第52-54页 |
6 基于DBLSTM-RNN的句边界检测 | 第54-70页 |
6.1 递归神经网络 | 第54-57页 |
6.1.1 前向传播 | 第54-56页 |
6.1.2 后向传播 | 第56页 |
6.1.3 双向递归神经网络 | 第56-57页 |
6.2 长短时记忆 | 第57-62页 |
6.2.1 前向传播 | 第59-61页 |
6.2.2 后向传播 | 第61-62页 |
6.3 DBLSTM-RNN句边界检测系统 | 第62-64页 |
6.4 实验与分析 | 第64-69页 |
6.4.1 实验设置 | 第64-65页 |
6.4.2 基于韵律特征的实验结果与分析 | 第65-66页 |
6.4.3 基于词汇特征的实验结果与分析 | 第66-68页 |
6.4.4 多类特征融合的实验结果与分析 | 第68-69页 |
6.5 本章小结 | 第69-70页 |
7 总结与展望 | 第70-72页 |
参考文献 | 第72-78页 |
致谢 | 第78-80页 |
科研成果发表 | 第80-81页 |