首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于LSA和段落聚类的自动文摘系统的研究

中文摘要第1-6页
ABSTRACT第6-10页
第一章 绪论第10-19页
   ·本课题研究背景及意义第10-11页
   ·国内外研究现状第11-14页
     ·国外研究现状第11-13页
     ·国内研究现状第13-14页
   ·自动文摘的研究方法第14-16页
     ·基于统计的自动文摘第14-15页
     ·基于理解的自动文摘第15页
     ·基于信息抽取的自动文摘第15页
     ·基于结构的自动文摘第15-16页
   ·自动文摘要考虑的因素及技术难点第16-17页
   ·论文的主要工作第17-19页
     ·本文的主要工作第17-18页
     ·论文组织结构第18-19页
第二章 潜在语义分析(LSA)第19-29页
   ·提出背景及相关数学概念第19-21页
     ·潜在语义分析的提出背景第19-20页
     ·潜在语义分析相关数学概念第20-21页
   ·LSA 理论基础第21-23页
     ·文本的“词汇-段落”矩阵第21页
     ·奇异值分解(SVD)第21-23页
     ·潜在语义空间表示第23页
   ·基于LSA 的权重计算第23-27页
     ·现有词汇权重计算方法第24-25页
     ·改进的词权计算方法第25-26页
     ·基于LSA 的相似度计算方法第26-27页
   ·结果分析与小结第27-29页
第三章 段落聚类算法的研究第29-36页
   ·聚类算法介绍第29-33页
     ·层次聚类方法第29-30页
     ·划分聚类方法第30-33页
   ·基于层次聚类和k-means 算法的聚类第33-36页
     ·k 值的确定第33页
     ·聚类算法中停止条件的确定第33-34页
     ·初始聚类质心的选择第34页
     ·小结第34-36页
第四章 基于LSA 和段落聚类的文摘系统的研究第36-49页
   ·系统设计综述第36页
     ·系统的总体设计思想第36页
     ·系统的总体结构第36页
   ·文本预处理第36-39页
     ·分词第37-38页
     ·去停用词第38-39页
   ·段落聚类第39-40页
     ·基于LSA 的段落聚类思想第39-40页
   ·摘要抽取与优化第40-44页
     ·句子权重计算第40-41页
     ·句子相似度计算第41-42页
     ·摘要句抽取第42-43页
     ·最终文摘生成第43-44页
   ·系统关键模块实现第44-49页
     ·主要模块介绍第44-45页
     ·关键代码实现第45-46页
     ·实现结果演示第46-49页
第五章 系统测评与分析第49-58页
   ·实验数据来源第49页
   ·测试第49-56页
     ·不同体裁的测试第52-54页
     ·不同主题的测试第54-56页
   ·小结第56-58页
第六章 全文总结与展望第58-60页
   ·研究工作总结第58-59页
   ·存在的问题及以后的研究工作第59-60页
参考文献第60-63页
致谢第63页

论文共63页,点击 下载论文
上一篇:全文检索及相关技术研究
下一篇:远程网络教育培训平台设计与实现