首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于主题句语义融合的多文档摘要算法研究

中文摘要第3-4页
英文摘要第4-5页
1 绪论第8-13页
    1.1 课题研究背景及意义第8页
    1.2 文本摘要研究现状第8-11页
        1.2.1 文本摘要技术的分类第8-9页
        1.2.2 国内外研究现状第9-11页
    1.3 本文研究工作第11-12页
    1.4 论文的结构安排第12-13页
2 多文档摘要相关技术第13-25页
    2.1 多文档摘要算法的常用框架第13-14页
    2.2 主题模型概述第14-19页
        2.2.1 词袋模型第15-16页
        2.2.2 隐性语义分析模型LSA第16页
        2.2.3 概率潜在语义分析模型PLSA第16-18页
        2.2.4 潜在狄立克雷分布模型LDA第18-19页
    2.3 语法分析第19-23页
        2.3.1 语义标注第19-20页
        2.3.2 词性短语的替换与重写第20-21页
        2.3.3 Simple NLG句子生成工具第21-23页
    2.4 摘要的评价方法第23-24页
        2.4.1 准确率、召回率与F值第23页
        2.4.2 ROUGE摘要句评测方法第23-24页
        2.4.3 Basic Elements评测方法第24页
    2.5 本章小结第24-25页
3 基于改进LDA模型的主题句聚类T-means算法第25-31页
    3.1 主题句聚类问题描述第25页
    3.2 句子主题分布模型第25-26页
    3.3 句子主题的计算模型第26-27页
        3.3.1 最佳主题数的选择第26页
        3.3.2 定义主题重要度的概念第26-27页
        3.3.3 候选主题句打分排序方式第27页
    3.4 主题句聚类T-means算法第27-30页
        3.4.1 文本聚类算法概述第27-28页
        3.4.2 T-means算法核心思想第28页
        3.4.3 T-means算法在主题句聚类实验分析对比第28-30页
    3.5 本章小结第30-31页
4 面向主题句语义融合的多文档摘要技术研究第31-48页
    4.1 多文档摘要的总体结构第31-35页
    4.2 主题聚类分析第35-36页
    4.3 基于整数线性规划的摘要候选句生成模型第36-39页
        4.3.1 短语权重计算第36页
        4.3.2 可兼容短语组合第36-37页
        4.3.3 短语内容优化函数第37页
        4.3.4 短语的替换与重写第37-38页
        4.3.5 生成摘要句第38-39页
    4.4 实验与结果分析第39-47页
        4.4.1 实验数据集介绍第39页
        4.4.2 最佳主题数的参数估计第39-42页
        4.4.3 摘要的评测指标第42页
        4.4.4 ROUGE自动评测结果第42-44页
        4.4.5 Pyramid自动评测结果第44-45页
        4.4.6 摘要范例分析第45-47页
    4.5 本章小结第47-48页
5 总结与展望第48-50页
    5.1 主要工作总结第48-49页
    5.2 未来工作展望第49-50页
致谢第50-51页
参考文献第51-56页
附录第56页
    A. 作者在攻读学位期间发表的论文目录第56页
    B. 作者在攻读学位期间取得的科研成果目录第56页

论文共56页,点击 下载论文
上一篇:复杂网络中重叠社区发现算法的研究
下一篇:基于邻居辅助策略的两阶段层次文本分类模型研究