摘要 | 第4-6页 |
Abstract | 第6-7页 |
第1章 绪论 | 第11-22页 |
1.1 课题来源及研究的目的和意义 | 第11-13页 |
1.1.1 课题背景 | 第11-13页 |
1.1.2 课题研究内容 | 第13页 |
1.2 国内外研究现状分析 | 第13-20页 |
1.2.1 新词发现 | 第13-15页 |
1.2.2 事件识别 | 第15-17页 |
1.2.3 文档自动摘要 | 第17-20页 |
1.3 本文研究的主要内容 | 第20-21页 |
1.4 本文的结构安排 | 第21-22页 |
第2章 基于bootstrapping的新词发现方法 | 第22-37页 |
2.1 新词发现任务概述 | 第22页 |
2.2 词向量和bootstrapping介绍 | 第22-25页 |
2.2.1 统计语言模型和词向量 | 第22-24页 |
2.2.2 Bootstrapping方法 | 第24-25页 |
2.3 基于Bootstrapping方法的新词发现 | 第25-31页 |
2.3.1 症状新词及其挖掘的基本流程 | 第26-27页 |
2.3.2 候选新词集及其初始化 | 第27-28页 |
2.3.3 候选新词的置信度评分 | 第28-30页 |
2.3.4 软模式更新和bootstrapping迭代 | 第30-31页 |
2.4 新词发现方法的评价 | 第31-35页 |
2.4.1 电子病历语料 | 第31-32页 |
2.4.2 三类新词的挖掘实验 | 第32-34页 |
2.4.3 词向量+词频向量和只使用词频向量的对比实验 | 第34-35页 |
2.4.4 和其他工作者的对比实验 | 第35页 |
2.5 本章小结 | 第35-37页 |
第3章 基于SVM特征提取的事件识别 | 第37-53页 |
3.1 事件识别概述 | 第37页 |
3.2 支持向量机及其特征选择简介 | 第37-40页 |
3.2.1 支持向量机模型 | 第37-39页 |
3.2.2 序列最优化SMO算法 | 第39-40页 |
3.3 基于SVM的事件类别识别 | 第40-45页 |
3.3.1 事件触发词和触发词的扩展 | 第40-43页 |
3.3.2 特征选择 | 第43-45页 |
3.4 基于SVM的事件元素识别 | 第45-47页 |
3.4.1 事件元素识别任务简介 | 第45页 |
3.4.2 特征选择 | 第45-47页 |
3.5 实验结果与分析 | 第47-51页 |
3.5.1 实验数据简介 | 第47-49页 |
3.5.2 事件类别识别实验结果 | 第49-50页 |
3.5.3 事件元素识别实验结果 | 第50-51页 |
3.6 本章小结 | 第51-53页 |
第4章 基于Text Rank和聚类的文档自动摘要 | 第53-66页 |
4.1 自动摘要概述 | 第53-54页 |
4.2 TextRank算法及其改进方法 | 第54-57页 |
4.2.1 Page Rank算法简介 | 第54-56页 |
4.2.2 Text Rank算法简介 | 第56-57页 |
4.3 基于聚类和TextRank的文档自动摘要方法 | 第57-61页 |
4.3.1 Text Rank无向图的生成 | 第58-59页 |
4.3.2 无向图聚类 | 第59-60页 |
4.3.3 自动摘要的生成 | 第60-61页 |
4.4 实验结果与分析 | 第61-64页 |
4.4.1 DUC2001上的实验结果 | 第62-63页 |
4.4.2 DUC2001上的实验结果 | 第63-64页 |
4.5 本章小结 | 第64-66页 |
结论 | 第66-68页 |
参考文献 | 第68-75页 |
攻读学位期间发表的学术论文 | 第75-76页 |
致谢 | 第76-77页 |
个人简历 | 第77-78页 |