摘要 | 第5-7页 |
Abstract | 第7-9页 |
第一章 绪论 | 第14-17页 |
1.1 研究背景 | 第14页 |
1.2 研究目的与意义 | 第14-15页 |
1.3 创新点 | 第15页 |
1.4 论文结构安排 | 第15-17页 |
第二章 研究综述 | 第17-37页 |
2.1 自动文摘 | 第17-30页 |
2.1.1 自动文摘的定义及其分类 | 第17-19页 |
2.1.2 自动文摘方法 | 第19-28页 |
2.1.3 自动文摘评价 | 第28-30页 |
2.2 TextRank算法 | 第30-37页 |
2.2.1 基于TextRank的关键词抽取 | 第31-32页 |
2.2.2 基于TextRank的文摘句抽取 | 第32-37页 |
第三章 研究设计 | 第37-46页 |
3.1 句子相似度计算 | 第37-43页 |
3.1.1 基于信息量的相似度计算方法 | 第38页 |
3.1.2 基于编辑距离的相似度计算方法 | 第38-39页 |
3.1.3 基于语义词典的相似度计算方法 | 第39页 |
3.1.4 基于BM25的相似度计算方法 | 第39-41页 |
3.1.5 基于BM25的改进相似度计算方法 | 第41-43页 |
3.2 句子权重计算 | 第43-46页 |
3.2.1 基于TextRank的句子权重 | 第43-44页 |
3.2.2 基于位置的句子权重 | 第44页 |
3.2.3 基于线索词的句子权重 | 第44-46页 |
第四章 实验与分析 | 第46-63页 |
4.1 实验语料库 | 第46页 |
4.2 实验环境 | 第46-47页 |
4.3 语料库预处理 | 第47-50页 |
4.3.1 内容提取 | 第47-48页 |
4.3.2 文本分割 | 第48-50页 |
4.4 实验指标 | 第50页 |
4.5 句子相似性分析 | 第50-61页 |
4.5.1 固定长度文摘(100个词项) | 第51-54页 |
4.5.2 可变长度文摘(压缩10%) | 第54-57页 |
4.5.3 可变长度文摘(压缩20%) | 第57-61页 |
4.6 句子权重分析 | 第61-63页 |
4.6.1 固定长度文摘(100个词项) | 第61页 |
4.6.2 可变长度文摘(压缩10%) | 第61-62页 |
4.6.3 可变长度文摘(压缩20%) | 第62-63页 |
第五章 结语 | 第63-65页 |
5.1 研究结论 | 第63-64页 |
5.2 进一步研究工作 | 第64-65页 |
参考文献 | 第65-73页 |
附录 | 第73-79页 |
附录1:DUC 2002原文AP880912-0095示例 | 第73-74页 |
附录2:本文提出的文摘方法产生AP880912-0095的文摘 | 第74-75页 |
附录3:DUC 2002原文LA122190-0149示例 | 第75-78页 |
附录4:本文提出的文摘方法产生LA122190-0149的文摘 | 第78-79页 |
致谢 | 第79-80页 |