创新点摘要 | 第5-6页 |
摘要 | 第6-7页 |
ABSTRACT | 第7-8页 |
第1章 绪论 | 第12-24页 |
1.1 研究背景及意义 | 第12-14页 |
1.2 自动文摘概述 | 第14-16页 |
1.3 国内外自动文摘研究现状 | 第16-22页 |
1.3.1 国外自动文摘的研究现状 | 第16-20页 |
1.3.2 国内自动文摘的研究现状 | 第20-22页 |
1.4 本文的组织结构及技术路线 | 第22-24页 |
1.4.1 组织结构 | 第22-23页 |
1.4.2 技术路线 | 第23-24页 |
第2章 自动文摘相关理论与方法 | 第24-43页 |
2.1 文摘的分类 | 第24-25页 |
2.2 单文档自动文摘的研究方法 | 第25-31页 |
2.2.1 基于形式特征的文摘方法 | 第25-28页 |
2.2.2 基于自然语言理解的文摘方法 | 第28页 |
2.2.3 基于信息抽取的文摘方法 | 第28-30页 |
2.2.4 基于文本篇章结构的文摘方法 | 第30-31页 |
2.3 多文档自动文摘的研究方法 | 第31-32页 |
2.4 自动文摘的评价方法 | 第32-39页 |
2.4.1 基于准确率和召回率的方法 | 第33-34页 |
2.4.2 基于Relative Utility的评价方法 | 第34-35页 |
2.4.3 DUC人工评价方法 | 第35-36页 |
2.4.4 基于ROUGE的自动评价方法 | 第36-38页 |
2.4.5 基于Pyramid的方法 | 第38-39页 |
2.4.6 基于Linguistic Quality的方法 | 第39页 |
2.5 向量空间模型 | 第39-42页 |
2.5.1 文本特征向量 | 第40-41页 |
2.5.2 基于VSM的文本相似度计算 | 第41-42页 |
2.6 本章小结 | 第42-43页 |
第3章 基于不同聚类指标的引用聚类 | 第43-80页 |
3.1 引言 | 第43-45页 |
3.2 相关研究工作 | 第45-52页 |
3.2.1 引用推荐相关研究 | 第45-46页 |
3.2.2 相似度/距离计算方法相关研究 | 第46-47页 |
3.2.3 引用上下文相关研究 | 第47-48页 |
3.2.4 共引分析相关研究 | 第48-51页 |
3.2.5 文本聚类的相关研究 | 第51-52页 |
3.3 文本表示方法 | 第52-62页 |
3.3.1 基于内容(摘要)的文本表示 | 第52-55页 |
3.3.2 基于引用上下文的文本表示 | 第55-57页 |
3.3.3 基于共引关联性的文本表示 | 第57-62页 |
3.4 文本相似度计算方法 | 第62-64页 |
3.4.1 传统的文本相似度计算方法 | 第62页 |
3.4.2 基于查询的文本相似度计算方法 | 第62-64页 |
3.5 文本聚类指标 | 第64-66页 |
3.6 文本聚类算法 | 第66-72页 |
3.6.1 常用的文本聚类算法 | 第66-69页 |
3.6.2 K-Medoids聚类方法 | 第69-72页 |
3.7 文本聚类的评价方法 | 第72-79页 |
3.7.1 聚类评价方法 | 第72-73页 |
3.7.2 常用的聚类评价指标 | 第73-75页 |
3.7.3 本文采用的聚类评价指标 | 第75-77页 |
3.7.4 实例分析 | 第77-79页 |
3.8 本章小结 | 第79-80页 |
第4章 基于查询的多文档自动文摘生成 | 第80-111页 |
4.1 引言 | 第80-81页 |
4.2 相关研究工作 | 第81-84页 |
4.3 句子重要性确定方法 | 第84-88页 |
4.3.1 常用的句子重要性确定方法 | 第84-87页 |
4.3.2 本文句子重要性确定方法 | 第87-88页 |
4.4 多文档文摘生成方法 | 第88-102页 |
4.4.1 基于LexRank的文摘生成方法 | 第88-92页 |
4.4.2 基于MMR的文摘生成方法 | 第92-95页 |
4.4.3 基于LexRankMMR的文摘生成 | 第95-97页 |
4.4.4 候选句子集选择方法 | 第97-99页 |
4.4.5 文摘长度确定方法 | 第99-101页 |
4.4.6 多文档文摘方法分类 | 第101-102页 |
4.5 文摘质量评价方法 | 第102-109页 |
4.5.1 生成段落与标准段落匹配方法 | 第102-104页 |
4.5.2 文摘质量评价方法 | 第104-106页 |
4.5.3 文摘质量评价实例 | 第106-109页 |
4.6 本章小结 | 第109-111页 |
第5章 基于引用聚类的多文档文摘生成实验 | 第111-133页 |
5.1 引用聚类实验 | 第111-120页 |
5.1.1 候选引用数据集 | 第111-112页 |
5.1.2 测试数据集 | 第112-113页 |
5.1.3 实验结果及分析 | 第113-120页 |
5.2 文摘生成实验 | 第120-132页 |
5.2.1 数据集 | 第120-121页 |
5.2.2 实验结果及分析 | 第121-129页 |
5.2.3 生成文摘实例 | 第129-132页 |
5.3 本章小结 | 第132-133页 |
第6章 总结与展望 | 第133-136页 |
6.1 总结 | 第133-134页 |
6.2 展望 | 第134-136页 |
参考文献 | 第136-151页 |
附录1 P、R、F_1、RI聚类评价指标的主要实现代码 | 第151-158页 |
附录2 基于PRECISION和RECALL的文摘质量比较 | 第158-164页 |
攻读学位期间公开发表论文和科研成果 | 第164-166页 |
致谢 | 第166-167页 |
作者简介 | 第167页 |