中文摘要 | 第3-4页 |
英文摘要 | 第4-5页 |
1 绪论 | 第9-15页 |
1.1 课题研究背景及意义 | 第9-10页 |
1.2 国内外研究现状 | 第10-12页 |
1.2.1 国外研究现状 | 第10-11页 |
1.2.2 国内研究现状 | 第11-12页 |
1.3 论文的研究目的和研究内容 | 第12-13页 |
1.3.1 研究目的 | 第12页 |
1.3.2 研究内容 | 第12-13页 |
1.4 论文结构 | 第13-15页 |
2 自动文摘的相关理论和技术 | 第15-25页 |
2.1 文摘的概念 | 第15-16页 |
2.1.1 文摘的定义 | 第15页 |
2.1.2 文摘的分类 | 第15-16页 |
2.2 自动文摘研究方法 | 第16-19页 |
2.2.1 基于统计的文摘方法 | 第16-17页 |
2.2.2 基于自然语言理解的文摘方法 | 第17页 |
2.2.3 基于信息抽取的文摘方法 | 第17-18页 |
2.2.4 基于文本篇章结构的文摘方法 | 第18-19页 |
2.3 句子的向量空间模型和相似度计算 | 第19-24页 |
2.3.1 中文分词技术 | 第19-20页 |
2.3.2 句子的向量空间模型 | 第20-22页 |
2.3.3 特征项的选择 | 第22页 |
2.3.4 特征项权重的计算 | 第22-23页 |
2.3.5 文本特征矩阵的构建 | 第23-24页 |
2.3.6 相似度的计算 | 第24页 |
2.4 本章小结 | 第24-25页 |
3 基于WORD2VEC的关键词抽取方法 | 第25-33页 |
3.1 方法的提出 | 第25页 |
3.2 传统的TEXTRANK的关键词抽取方法 | 第25-27页 |
3.2.1 关键词抽取方法概述 | 第25-26页 |
3.2.2 TextRank算法思想 | 第26-27页 |
3.2.3 TextRank方法流程 | 第27页 |
3.3 WORD2VECTOR算法 | 第27-29页 |
3.3.1 算法原理 | 第27-29页 |
3.3.2 计算词汇相似度 | 第29页 |
3.4 融合WORD2VEC的关键词抽取方法 | 第29-32页 |
3.4.1 算法思想 | 第29-30页 |
3.4.2 算法步骤 | 第30-32页 |
3.4.3 算法分析 | 第32页 |
3.5 本章小结 | 第32-33页 |
4 基于关键词过滤和篇章结构的自动文摘方法KS-TEXTRANK | 第33-40页 |
4.1 方法的提出 | 第33页 |
4.2 改进的KS-TEXTRANK算法思想 | 第33-34页 |
4.3 改进的KS-TEXTRANK算法模型 | 第34-39页 |
4.3.1 改进策略 | 第34-35页 |
4.3.2 关键词抽取方法的选用 | 第35-36页 |
4.3.3 算法流程和描述 | 第36-39页 |
4.3.4 算法分析 | 第39页 |
4.4 本章小结 | 第39-40页 |
5 实验及结果分析 | 第40-49页 |
5.1 实验设计思路 | 第40-41页 |
5.2 实验评估方法 | 第41-43页 |
5.2.1 面向论文摘要的相似度评价方法 | 第42页 |
5.2.2 基于准确率、召回率和F-measure值的评价方法 | 第42-43页 |
5.2.3 基于文摘均匀度与覆盖率的评价方法 | 第43页 |
5.3 实验结果分析 | 第43-48页 |
5.3.1 三种自动文摘系统的摘要相似度比较 | 第43-44页 |
5.3.2 三种系统平均准确率、平均召回率与F值对比 | 第44-45页 |
5.3.3 三种自动文摘系统的均匀度与覆盖率比较 | 第45-46页 |
5.3.4 词向量模型对自动文摘质量的影响 | 第46-48页 |
5.4 本章小结 | 第48-49页 |
6 总结与展望 | 第49-51页 |
6.1 本文总结 | 第49-50页 |
6.2 工作展望 | 第50-51页 |
致谢 | 第51-52页 |
参考文献 | 第52-56页 |
附录 | 第56页 |
A.作者在攻读硕士学位期间发表的论文目录 | 第56页 |
B.作者在攻读硕士学位期间参与的科研项目 | 第56页 |