首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于自适应聚类的中文多文档自动文摘研究

摘要第1-5页
Abstract第5-7页
目录第7-10页
第1章 绪论第10-18页
   ·自动文摘技术的研究意义和相关概念第10-11页
     ·研究意义第10-11页
     ·相关概念第11页
   ·自动文摘的国内外研究状况第11-16页
     ·单文档自动文摘的研究状况第11-14页
     ·多文档自动文摘的研究状况第14-15页
     ·自动文摘评价方法第15-16页
   ·研究内容第16-17页
   ·论文内容安排第17-18页
第2章 相关理论及关键技术第18-30页
   ·基于向量空间模型的特征向量表达第18-20页
     ·向量空间模型介绍第18页
     ·文本的向量化表示第18-19页
     ·特征项的选取第19页
     ·特征项的权重计算第19-20页
   ·特征空间的优化第20-23页
     ·潜在语义分析第20-21页
     ·同义词合并第21-23页
   ·文本聚类第23-29页
     ·层次聚类算法第24-25页
     ·扁平分割聚类算法第25-27页
     ·基于密度的聚类算法第27-29页
     ·基于网格的聚类算法第29页
   ·本章小结第29-30页
第3章 基于改进的K-means聚类算法的子主题发现方法第30-40页
   ·相关研究工作第30-31页
   ·文本向量空间的构造及优化第31-34页
     ·文本向量空间构造第31-32页
     ·基于《知网》的同义项合并第32-34页
   ·构建向量之间的距离矩阵第34-35页
   ·子主题的自适应识别第35-36页
   ·基于子主题发现的文摘句抽取第36-39页
     ·相关方法第36-38页
     ·基于质心的方法第38-39页
   ·本章小节第39-40页
第4章 中文多文档自动文摘系统的设计与实现第40-46页
   ·系统体系结构第40-41页
   ·预处理模块第41-42页
     ·分句、分词、词性标注第41页
     ·停用词处理第41-42页
     ·稀有词处理第42页
   ·子主题发现模块第42-43页
   ·文摘句抽取模块第43-44页
   ·文摘生成模块第44-45页
     ·时间次序排序法第44页
     ·多数次序排序法第44-45页
   ·本章小结第45-46页
第5章 实验结果与分析第46-52页
   ·评价方法第46-47页
   ·实验语料第47页
   ·实验设计第47-51页
   ·本章小结第51-52页
第6章 结论与展望第52-54页
   ·本文总结第52-53页
   ·展望第53-54页
参考文献第54-57页
攻读硕士学位期间参加的科研项目与公开发表的学术论文第57-58页
致谢第58页

论文共58页,点击 下载论文
上一篇:虚拟场景中手势控制模型研究
下一篇:混合式学习在电大的《计算机应用基础》课程教学中的应用实践研究