首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

Web文档聚类在搜索引擎中的应用研究

摘要第1-7页
ABSTRACT第7-12页
第1章 绪论第12-21页
   ·论文选题的意义第12-14页
     ·研究背景第12页
     ·搜索引擎面临的问题第12-13页
     ·国内外研究现状第13-14页
   ·搜索引擎简介第14-18页
     ·搜索引擎发展史第14-17页
     ·搜索引擎分类第17-18页
     ·搜索引擎评价标准第18页
   ·论文研究内容及结构安排第18-21页
     ·研究内容第18-19页
     ·文章的组织结构第19-21页
第2章 相关理论介绍第21-31页
   ·搜索引擎工作原理第21-25页
     ·网页搜集第21-22页
     ·网页处理第22-23页
     ·查询服务第23-25页
   ·文本聚类理论第25-28页
     ·聚类第25页
     ·文本聚类第25-26页
     ·中文分词第26-27页
     ·经典文本聚类算法第27-28页
   ·文本聚类系统第28-30页
     ·文本聚类系统概念第28-29页
     ·文本聚类系统的应用第29页
     ·现有的聚类系统第29-30页
   ·本章小结第30-31页
第3章 后缀树聚类算法的改进第31-40页
   ·STC算法第31-34页
     ·后缀树的性质第31页
     ·STC算法步骤第31-33页
     ·STC算法的缺点第33-34页
   ·改进后的算法STC-I第34-37页
     ·预处理第34页
     ·计算相关度第34-35页
     ·去除同义词、近义词第35-36页
     ·确定基类第36-37页
     ·合并基类第37页
   ·实验第37-39页
   ·本章小结第39-40页
第4章 基于主题的聚类算法的研究第40-49页
   ·熵、相对熵和互信息第40-43页
     ·定义第40-42页
     ·分类问题中的互信息第42-43页
   ·HTBC第43-46页
     ·预处理第44页
     ·建立主题向量第44-45页
     ·生成词类第45页
     ·主题聚类第45-46页
   ·实验第46-48页
     ·评价标准第46-47页
     ·实验分析第47-48页
   ·本章小结第48-49页
第5章 带聚类模块的搜索引擎设计第49-61页
   ·系统架构第49-50页
     ·开发环境第49页
     ·系统框架第49-50页
   ·搜集器第50-52页
   ·索引器第52-55页
     ·预处理第53页
     ·分词第53-54页
     ·生成索引第54-55页
   ·检索器第55-56页
     ·高级查询第55-56页
     ·结果排序第56页
   ·聚类模块第56-57页
   ·系统运行情况分析第57-60页
     ·用户查询界面第57-58页
     ·聚类模块运行结果第58-60页
   ·本章小结第60-61页
第6章 总结与展望第61-63页
   ·总结第61-62页
   ·展望第62-63页
致谢第63-64页
参考文献第64-67页
读研期间发表和录用论文目录第67页

论文共67页,点击 下载论文
上一篇:基于序列模式挖掘的入侵检测研究
下一篇:实时任务的最好响应时间精确分析与计算