第一章 绪论 | 第1-13页 |
·问题的提出 | 第11页 |
·本文的研究内容 | 第11-12页 |
·本文的组织结构 | 第12-13页 |
第二章 Web信息检索简介 | 第13-24页 |
·搜索引擎的起源和发展 | 第13-14页 |
·搜索引擎的体系结构和工作原理 | 第14-16页 |
·搜索引擎的组成部分 | 第14-16页 |
·搜索引擎的工作流程 | 第16页 |
·搜索引擎的主要指标及其分析 | 第16-19页 |
·存在的问题 | 第19-21页 |
·当前的研究热点 | 第21-24页 |
第三章 网页分类算法研究 | 第24-46页 |
·基于文本的网页分类 | 第24-31页 |
·文本分类简介 | 第24页 |
·文本分类中的关键技术 | 第24-31页 |
·文本表示 | 第24-27页 |
·特征提取 | 第27-28页 |
·分类算法 | 第28-31页 |
·基于结构的网页分类 | 第31-32页 |
·基于链接结构的网页分类 | 第32-37页 |
·基于文本分类的缺点 | 第32页 |
·web链接与页面内容的关系 | 第32-33页 |
·基于链接结构的网页分类算法 | 第33-37页 |
·在分类中引入邻居网页的内容 | 第34页 |
·在分类中引入邻居网页的类别 | 第34-37页 |
·一个新的基于链接结构的网页分类算法 | 第37-45页 |
·算法基本思想 | 第37-39页 |
·算法的实现 | 第39-44页 |
·实验结果 | 第44-45页 |
·本章小结 | 第45-46页 |
第四章 面向特定主题的Web信息检索技术研究 | 第46-61页 |
·Focused Crawling简介 | 第46-47页 |
·Focused Crawling系统的结构 | 第47-48页 |
·Focused Crawling系统的工作流程 | 第48-49页 |
·Focused Crawling系统的关键技术 | 第49-52页 |
·Focused Crawling的问题描述 | 第49-50页 |
·Focused Crawling的关键问题 | 第50-52页 |
·分类(Classify) | 第50-51页 |
·蒸馏(distillation) | 第51-52页 |
·搜索器与分类器和蒸馏器的集成 | 第52页 |
·基于Context Graph的Focused Crawling系统及其改进 | 第52-58页 |
·基本思想 | 第52页 |
·产生示例网页集的Context Graph | 第52-54页 |
·分类 | 第54-55页 |
·工作过程 | 第55-56页 |
·Context Graph方法的缺点 | 第56页 |
·Context Graph方法的改进 | 第56-58页 |
·一个基于链接结构的Focused Crawling系统 | 第58-60页 |
·本章小结 | 第60-61页 |
第五章 实验及分析 | 第61-67页 |
·实验系统简介 | 第61-62页 |
·系统功能介绍 | 第62-64页 |
·实验结果及分析 | 第64-67页 |
第六章 总结与展望 | 第67-69页 |
·全文总结 | 第67页 |
·下一步的研究方向和内容 | 第67-69页 |
参考文献 | 第69-72页 |