首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于内容的中文Web文档聚类方法研究与应用

第一章 引言第1-14页
   ·研究背景和意义第10-12页
   ·本文主要工作第12页
   ·本文章节安排第12-14页
第二章 WEB 文本聚类技术概述第14-30页
   ·WEB 文本聚类技术背景第14-16页
   ·不考虑文本语序的聚类方法第16-22页
     ·向量空间模型第16-19页
     ·相似度计算方法第19-20页
     ·聚类算法第20-22页
   ·对于中文文本聚类时需要考虑的问题第22-27页
     ·现有的中文分词技术第23-24页
     ·中文分词技术中的难题第24-26页
     ·对“中文分词+VSM 模型”的聚类方式思考第26-27页
   ·考虑文本语序的聚类方法第27-29页
     ·后缀树模型第27-28页
     ·利用后缀树进行聚类第28-29页
   ·小结第29-30页
第三章 一种新的基于短语匹配的中文文本聚类算法第30-42页
   ·引言第30-31页
   ·文档索引图模型第31-35页
     ·文档索引图的定义第31-32页
     ·表示文档索引图的数据结构第32-33页
     ·文档之间相似度的定义第33页
     ·文档索引图的构造过程第33-35页
     ·文档索引图的复杂度分析第35页
   ·增量的在线聚类算法第35-41页
     ·增量聚类算法第36页
     ·基于相似度区间的增量聚类方法第36-37页
     ·增量聚类算法描述第37-40页
     ·算法的复杂度分析第40-41页
   ·小结第41-42页
第四章 MINERONWEB 数据挖掘服务系统第42-54页
   ·系统的开发背景与设计特点第42-44页
     ·系统的目标第42-43页
     ·系统的特点第43-44页
   ·技术路线和总体设计第44-49页
     ·技术路线第44-45页
     ·系统总体设计和模块划分第45-47页
     ·系统结构第47-48页
     ·系统的运行部署第48-49页
   ·应用服务器端的实现第49-51页
   ·WEB 端的实现第51-52页
   ·小结第52-54页
第五章 中文搜索引擎结果聚类子系统的设计与实现第54-73页
   ·前言第54-55页
   ·中文搜索引擎结果聚类子系统概述第55-56页
   ·重要数据结构的定义第56-59页
   ·应用服务器端的设计与实现第59-67页
     ·应用服务器端的需求分析第59页
     ·服务器端的模块划分第59-60页
     ·获取搜索结果模块第60-62页
     ·文档索引图构造模块第62-64页
     ·聚类算法模块第64-65页
     ·重构搜索结果展示页面模块第65-66页
     ·应用服务器端EJB 组件的设计和封装第66-67页
   ·WEB 端的设计与实现第67-68页
   ·运行结果分析第68-71页
   ·小结第71-73页
第六章 结论和展望第73-74页
致谢第74-75页
参考文献第75-78页
附录1第78-79页
附录2第79-80页
附录3第80-82页
附录4第82-83页
硕士期间研究成果第83页

论文共83页,点击 下载论文
上一篇:嵌入式电脑横机控制系统的研究
下一篇:钢筋混凝土异形柱框架抗震性能试验研究与弹塑性分析