首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于单事件新闻多文档聚类及自动文摘的设计与实现

摘要第4-5页
Abstract第5-6页
第一章 绪论第13-21页
    1.1 研究的目的和意义第13-14页
    1.2 多文档自动文摘研究现状第14-18页
        1.2.1 国外的研究情况第14-16页
        1.2.2 国内的研究情况第16-17页
        1.2.3 多文档自动文摘句子评分算法第17-18页
    1.3 话题检测与跟踪技术研究现状第18-19页
    1.4 本文的研究工作第19-20页
    1.5 本文的组织结构第20-21页
第二章 文本处理的关键技术第21-35页
    2.1 文本预处理第21-22页
        2.1.1 中文分词第21-22页
        2.1.2 过滤停用词第22页
    2.2 文本表示第22-25页
        2.2.1 向量空间模型第22-23页
        2.2.2 潜在语义索引(LSI)模型第23-24页
        2.2.3 概率潜在语义索引(PLSI)模型第24-25页
    2.3 文本特征选择第25-27页
    2.4 常见的几种文本聚类分类算法第27-31页
        2.4.1 分类算法第27-28页
        2.4.2 聚类算法第28-31页
    2.5 文本分类聚类的评价指标第31-33页
        2.5.1 文本分类的性能评价第31-32页
        2.5.2 文本聚类的性能评价第32-33页
    2.6 文本摘要的评价指标第33-34页
    2.7 本章总结第34-35页
第三章 单事件新闻聚类系统第35-49页
    3.1 系统的总体设计思路第35-36页
    3.2 基于LDA模型的文本相似度计算第36-45页
        3.3.1 LDA模型介绍第37-45页
        3.3.2 基于LDA的文本相似度计算第45页
    3.3 基于LDA主题模型的文本分类和聚类第45-48页
        3.3.1 基于LDA主题模型的KNN新闻分类第46-47页
        3.3.2 基于LDA主题模型的Single-Pass文本聚类第47-48页
    3.4 本章小结第48-49页
第四章 基于LexRank的单事件多文档文摘第49-61页
    4.1 多文档文摘系统的总体设计思路第49-51页
    4.2 基于知网的向量空间模型第51-53页
    4.3 基于LexRank算法的句子权重计算第53-58页
        4.3.1 起源-PageRank算法第53-54页
        4.3.2 LexRank算法介绍第54-57页
        4.3.3 基于句子多特征与LexRank算法相融合的句子权重计算第57-58页
    4.4 文摘抽取第58-60页
    4.5 本章小结第60-61页
第五章 实验结果分析第61-69页
    5.1 实验语料选择第61页
    5.2 实验环境第61页
    5.3 文本分类聚类实验第61-64页
        5.3.1 基于LDA模型的KNN算法实验结果分析第61-63页
        5.3.2 基于LDA模型的Single-Pass聚类实验结果分析第63-64页
    5.4 多文档文摘实验结果分析第64-69页
        5.4.1 多文档文摘系统演示第64-66页
        5.4.2 摘要生成结果及分析第66-69页
第六章 总结与展望第69-71页
    6.1 论文工作总结第69页
    6.2 展望第69-71页
参考文献第71-74页
硕士在读期间科研成果介绍第74-75页
致谢第75页

论文共75页,点击 下载论文
上一篇:哈萨克语固定词组提取系统的设计与实现
下一篇:信贷业务数据查询系统的设计与实现