基于引用聚类的多文档自动文摘技术研究

创新点摘要	第5-6页
摘要	第6-7页
ABSTRACT	第7-8页
第1章绪论	第12-24页
1.1 研究背景及意义	第12-14页
1.2 自动文摘概述	第14-16页
1.3 国内外自动文摘研究现状	第16-22页
1.3.1 国外自动文摘的研究现状	第16-20页
1.3.2 国内自动文摘的研究现状	第20-22页
1.4 本文的组织结构及技术路线	第22-24页
1.4.1 组织结构	第22-23页
1.4.2 技术路线	第23-24页
第2章自动文摘相关理论与方法	第24-43页
2.1 文摘的分类	第24-25页
2.2 单文档自动文摘的研究方法	第25-31页
2.2.1 基于形式特征的文摘方法	第25-28页
2.2.2 基于自然语言理解的文摘方法	第28页
2.2.3 基于信息抽取的文摘方法	第28-30页
2.2.4 基于文本篇章结构的文摘方法	第30-31页
2.3 多文档自动文摘的研究方法	第31-32页
2.4 自动文摘的评价方法	第32-39页
2.4.1 基于准确率和召回率的方法	第33-34页
2.4.2 基于Relative Utility的评价方法	第34-35页
2.4.3 DUC人工评价方法	第35-36页
2.4.4 基于ROUGE的自动评价方法	第36-38页
2.4.5 基于Pyramid的方法	第38-39页
2.4.6 基于Linguistic Quality的方法	第39页
2.5 向量空间模型	第39-42页
2.5.1 文本特征向量	第40-41页
2.5.2 基于VSM的文本相似度计算	第41-42页
2.6 本章小结	第42-43页
第3章基于不同聚类指标的引用聚类	第43-80页
3.1 引言	第43-45页
3.2 相关研究工作	第45-52页
3.2.1 引用推荐相关研究	第45-46页
3.2.2 相似度/距离计算方法相关研究	第46-47页
3.2.3 引用上下文相关研究	第47-48页
3.2.4 共引分析相关研究	第48-51页
3.2.5 文本聚类的相关研究	第51-52页
3.3 文本表示方法	第52-62页
3.3.1 基于内容(摘要)的文本表示	第52-55页
3.3.2 基于引用上下文的文本表示	第55-57页
3.3.3 基于共引关联性的文本表示	第57-62页
3.4 文本相似度计算方法	第62-64页
3.4.1 传统的文本相似度计算方法	第62页
3.4.2 基于查询的文本相似度计算方法	第62-64页
3.5 文本聚类指标	第64-66页
3.6 文本聚类算法	第66-72页
3.6.1 常用的文本聚类算法	第66-69页
3.6.2 K-Medoids聚类方法	第69-72页
3.7 文本聚类的评价方法	第72-79页
3.7.1 聚类评价方法	第72-73页
3.7.2 常用的聚类评价指标	第73-75页
3.7.3 本文采用的聚类评价指标	第75-77页
3.7.4 实例分析	第77-79页
3.8 本章小结	第79-80页
第4章基于查询的多文档自动文摘生成	第80-111页
4.1 引言	第80-81页
4.2 相关研究工作	第81-84页
4.3 句子重要性确定方法	第84-88页
4.3.1 常用的句子重要性确定方法	第84-87页
4.3.2 本文句子重要性确定方法	第87-88页
4.4 多文档文摘生成方法	第88-102页
4.4.1 基于LexRank的文摘生成方法	第88-92页
4.4.2 基于MMR的文摘生成方法	第92-95页
4.4.3 基于LexRankMMR的文摘生成	第95-97页
4.4.4 候选句子集选择方法	第97-99页
4.4.5 文摘长度确定方法	第99-101页
4.4.6 多文档文摘方法分类	第101-102页
4.5 文摘质量评价方法	第102-109页
4.5.1 生成段落与标准段落匹配方法	第102-104页
4.5.2 文摘质量评价方法	第104-106页
4.5.3 文摘质量评价实例	第106-109页
4.6 本章小结	第109-111页
第5章基于引用聚类的多文档文摘生成实验	第111-133页
5.1 引用聚类实验	第111-120页
5.1.1 候选引用数据集	第111-112页
5.1.2 测试数据集	第112-113页
5.1.3 实验结果及分析	第113-120页
5.2 文摘生成实验	第120-132页
5.2.1 数据集	第120-121页
5.2.2 实验结果及分析	第121-129页
5.2.3 生成文摘实例	第129-132页
5.3 本章小结	第132-133页
第6章总结与展望	第133-136页
6.1 总结	第133-134页
6.2 展望	第134-136页
参考文献	第136-151页
附录1 P、R、F_1、RI聚类评价指标的主要实现代码	第151-158页
附录2 基于PRECISION和RECALL的文摘质量比较	第158-164页
攻读学位期间公开发表论文和科研成果	第164-166页
致谢	第166-167页
作者简介	第167页