首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于引用聚类的多文档自动文摘技术研究

创新点摘要第5-6页
摘要第6-7页
ABSTRACT第7-8页
第1章 绪论第12-24页
    1.1 研究背景及意义第12-14页
    1.2 自动文摘概述第14-16页
    1.3 国内外自动文摘研究现状第16-22页
        1.3.1 国外自动文摘的研究现状第16-20页
        1.3.2 国内自动文摘的研究现状第20-22页
    1.4 本文的组织结构及技术路线第22-24页
        1.4.1 组织结构第22-23页
        1.4.2 技术路线第23-24页
第2章 自动文摘相关理论与方法第24-43页
    2.1 文摘的分类第24-25页
    2.2 单文档自动文摘的研究方法第25-31页
        2.2.1 基于形式特征的文摘方法第25-28页
        2.2.2 基于自然语言理解的文摘方法第28页
        2.2.3 基于信息抽取的文摘方法第28-30页
        2.2.4 基于文本篇章结构的文摘方法第30-31页
    2.3 多文档自动文摘的研究方法第31-32页
    2.4 自动文摘的评价方法第32-39页
        2.4.1 基于准确率和召回率的方法第33-34页
        2.4.2 基于Relative Utility的评价方法第34-35页
        2.4.3 DUC人工评价方法第35-36页
        2.4.4 基于ROUGE的自动评价方法第36-38页
        2.4.5 基于Pyramid的方法第38-39页
        2.4.6 基于Linguistic Quality的方法第39页
    2.5 向量空间模型第39-42页
        2.5.1 文本特征向量第40-41页
        2.5.2 基于VSM的文本相似度计算第41-42页
    2.6 本章小结第42-43页
第3章 基于不同聚类指标的引用聚类第43-80页
    3.1 引言第43-45页
    3.2 相关研究工作第45-52页
        3.2.1 引用推荐相关研究第45-46页
        3.2.2 相似度/距离计算方法相关研究第46-47页
        3.2.3 引用上下文相关研究第47-48页
        3.2.4 共引分析相关研究第48-51页
        3.2.5 文本聚类的相关研究第51-52页
    3.3 文本表示方法第52-62页
        3.3.1 基于内容(摘要)的文本表示第52-55页
        3.3.2 基于引用上下文的文本表示第55-57页
        3.3.3 基于共引关联性的文本表示第57-62页
    3.4 文本相似度计算方法第62-64页
        3.4.1 传统的文本相似度计算方法第62页
        3.4.2 基于查询的文本相似度计算方法第62-64页
    3.5 文本聚类指标第64-66页
    3.6 文本聚类算法第66-72页
        3.6.1 常用的文本聚类算法第66-69页
        3.6.2 K-Medoids聚类方法第69-72页
    3.7 文本聚类的评价方法第72-79页
        3.7.1 聚类评价方法第72-73页
        3.7.2 常用的聚类评价指标第73-75页
        3.7.3 本文采用的聚类评价指标第75-77页
        3.7.4 实例分析第77-79页
    3.8 本章小结第79-80页
第4章 基于查询的多文档自动文摘生成第80-111页
    4.1 引言第80-81页
    4.2 相关研究工作第81-84页
    4.3 句子重要性确定方法第84-88页
        4.3.1 常用的句子重要性确定方法第84-87页
        4.3.2 本文句子重要性确定方法第87-88页
    4.4 多文档文摘生成方法第88-102页
        4.4.1 基于LexRank的文摘生成方法第88-92页
        4.4.2 基于MMR的文摘生成方法第92-95页
        4.4.3 基于LexRankMMR的文摘生成第95-97页
        4.4.4 候选句子集选择方法第97-99页
        4.4.5 文摘长度确定方法第99-101页
        4.4.6 多文档文摘方法分类第101-102页
    4.5 文摘质量评价方法第102-109页
        4.5.1 生成段落与标准段落匹配方法第102-104页
        4.5.2 文摘质量评价方法第104-106页
        4.5.3 文摘质量评价实例第106-109页
    4.6 本章小结第109-111页
第5章 基于引用聚类的多文档文摘生成实验第111-133页
    5.1 引用聚类实验第111-120页
        5.1.1 候选引用数据集第111-112页
        5.1.2 测试数据集第112-113页
        5.1.3 实验结果及分析第113-120页
    5.2 文摘生成实验第120-132页
        5.2.1 数据集第120-121页
        5.2.2 实验结果及分析第121-129页
        5.2.3 生成文摘实例第129-132页
    5.3 本章小结第132-133页
第6章 总结与展望第133-136页
    6.1 总结第133-134页
    6.2 展望第134-136页
参考文献第136-151页
附录1 P、R、F_1、RI聚类评价指标的主要实现代码第151-158页
附录2 基于PRECISION和RECALL的文摘质量比较第158-164页
攻读学位期间公开发表论文和科研成果第164-166页
致谢第166-167页
作者简介第167页

论文共167页,点击 下载论文
上一篇:国际财务报告准则第9号的出台及其对中国银行业的预期影响研究
下一篇:内部控制视角下我国商业银行信贷风险控制研究--基于中国建设银行的案例分析