主题WEB搜索引擎优化与实现研究

摘要	第1-6页
ABSTRACT	第6-7页
致谢	第7-11页
第一章引言	第11-15页
·本课题的研究背景	第11-12页
·主题WEB 搜索引擎发展现状分析	第12-13页
·本论文的主要工作	第13页
·本论文的组织	第13-15页
第二章通用搜索引擎技术概述	第15-22页
·搜索引擎的发展	第15-16页
·搜索引擎的分类	第16-18页
·通用搜索引擎的结构和工作原理	第18-20页
·小结	第20-22页
第三章主题WEB 搜索引擎	第22-35页
·主题WEB 搜索研究背景	第22-23页
·主题搜索引擎和通用搜索引擎的差异	第23-24页
·主题WEB 搜索的关键技术	第24-31页
·主题网络蜘蛛搜索策略	第24-28页
·网页文档的分类与索引技术	第28-30页
·搜索结果表现技术	第30-31页
·主题网络蜘蛛技术	第31-34页
·主题网络蜘蛛的工作方式	第32-33页
·目前主题网络爬虫存在的问题	第33-34页
·主题网络爬虫的性能评价	第34页
·小结	第34-35页
第四章主题WEB 挖掘系统设计	第35-43页
·主题WEB 挖掘系统	第35-37页
·系统结构设计	第36页
·主题网络蜘蛛(Topical Spider)类的构成	第36-37页
·页面主题相关度计算	第37页
·Best-First 爬行策略的优化	第37-41页
·Best-First 算法分析	第37-38页
·Best-First 算法的优化	第38-40页
·改进的Best-First 算法实验结果	第40-41页
·基于 javascript 等多链接分析的链接地址提取	第41-42页
·网页链接现状分析	第41页
·javascript 动态网页地址提取方法	第41-42页
·不同链接分析策略实验结果比较	第42页
·小结	第42-43页
第五章主题WEB 挖掘系统的实现	第43-47页
·C#语言特点介绍	第43页
·系统实现的关键技术	第43-46页
·主题网络蜘蛛类	第43-44页
·系统控制中心设计	第44-46页
·主题WEB 挖掘系统总体性能测试	第46页
·小结	第46-47页
第六章总结和展望	第47-48页
·工作总结	第47页
·进一步做的工作	第47-48页
参考文献	第48-51页
攻读学位期间的主要科研工作	第51-52页