| 目录 | 第1-13页 |
| 摘要 | 第13-17页 |
| ABSTRACT | 第17-22页 |
| 第1章 绪论 | 第22-41页 |
| ·课题研究的背景和意义 | 第22-24页 |
| ·搜索引擎及发展 | 第24-29页 |
| ·搜索引擎的发展 | 第24-26页 |
| ·搜索引擎的基本原理 | 第26-27页 |
| ·搜索引擎的分类 | 第27-28页 |
| ·通用搜索引擎的局限性 | 第28-29页 |
| ·垂直搜索引擎 | 第29页 |
| ·主题爬行技术 | 第29-34页 |
| ·爬行技术简介 | 第29-31页 |
| ·主题爬行 | 第31-34页 |
| ·论文的主要研究内容与贡献 | 第34-39页 |
| ·基于分类法的上下文主题描述 | 第34-35页 |
| ·面向主题爬行的在线网页分块 | 第35-36页 |
| ·基于多粒度的待爬行URLs优先级计算 | 第36-38页 |
| ·自适应主题爬行算法 | 第38-39页 |
| ·基于原型系统的实验分析 | 第39页 |
| ·论文的组织结构 | 第39-41页 |
| 第2章 基于分类法的上下文主题描述 | 第41-52页 |
| ·概述 | 第41-45页 |
| ·主题描述方法 | 第41-43页 |
| ·主题描述方法的应用 | 第43-44页 |
| ·存在问题 | 第44-45页 |
| ·基于分类法的上下文主题描述 | 第45-49页 |
| ·主题向量表示 | 第49-51页 |
| ·本章小结 | 第51-52页 |
| 第3章 面向主题爬行的在线网页分块 | 第52-69页 |
| ·概述 | 第52-57页 |
| ·网页分块 | 第52-54页 |
| ·网页分块在信息检索中的应用 | 第54-55页 |
| ·网页分块在主题爬行中的应用 | 第55-56页 |
| ·存在问题 | 第56-57页 |
| ·面向主题爬行的在线网页分块 | 第57-65页 |
| ·文本块与链接块识别算法 | 第61-64页 |
| ·主题文本识别算法 | 第64页 |
| ·相关链接块识别算法 | 第64-65页 |
| ·实验分析 | 第65-67页 |
| ·本章小结 | 第67-69页 |
| 第4章 基于多粒度的待爬行URLs优先级计算 | 第69-89页 |
| ·概述 | 第69-72页 |
| ·相关工作 | 第69-71页 |
| ·存在问题 | 第71-72页 |
| ·主要贡献 | 第72页 |
| ·TCURLs优先级计算的规范化描述 | 第72-74页 |
| ·基于网页粒度的TCURLs优先级计算 | 第74-75页 |
| ·基于站点粒度的YCURLs优先级计算 | 第75-76页 |
| ·基于块粒度的TCURLs优先级计算 | 第76-78页 |
| ·基于链接粒度的TCURLs优先级计算 | 第78-87页 |
| ·基于锚文本的TCURLs优先级计算 | 第78-79页 |
| ·基于URL地址的TCURLs优先级计算 | 第79-83页 |
| ·基于链接类型的TCURLs优先级计算 | 第83-87页 |
| ·基于多粒度的TCURLs优先级计算 | 第87页 |
| ·本章小结 | 第87-89页 |
| 第5章 自适应主题爬行算法 | 第89-98页 |
| ·概述 | 第89-92页 |
| ·相关工作 | 第89-92页 |
| ·存在问题 | 第92页 |
| ·基于多粒度优先级计算的自适应主题爬行算法 | 第92-96页 |
| ·不同粒度优先级计算策略的先后顺序 | 第92-94页 |
| ·自适应路径探测深度 | 第94页 |
| ·自适应主题爬行算法 | 第94-96页 |
| ·本章小结 | 第96-98页 |
| 第6章 基于原型系统的实验分析 | 第98-117页 |
| ·主题爬行原型系统 | 第98-99页 |
| ·基准算法 | 第99-100页 |
| ·宽度优先算法 | 第99-100页 |
| ·最佳优先算法 | 第100页 |
| ·Fish-Search和Shark-Search算法 | 第100页 |
| ·评测指标 | 第100-101页 |
| ·主题和种子URLs | 第101-102页 |
| ·参数设置 | 第102-103页 |
| ·实验结果分析 | 第103-115页 |
| ·总体性能 | 第103-104页 |
| ·基于分类法的上下文主题描述方法的性能 | 第104-107页 |
| ·在线网页分块方法的性能 | 第107-108页 |
| ·基于URL地址的优先级计算的性能 | 第108-111页 |
| ·单个粒度优先级计算的性能 | 第111-113页 |
| ·自适应路径探测深度的性能 | 第113-114页 |
| ·时间性能 | 第114-115页 |
| ·本章小结 | 第115-117页 |
| 第7章 总结与展望 | 第117-122页 |
| ·本文总结 | 第117-119页 |
| ·研究展望 | 第119-122页 |
| 参考文献 | 第122-134页 |
| 致谢 | 第134-136页 |
| 攻读学位期间发表的学术论文 | 第136-138页 |
| 在读期间参与科研项目情况 | 第138-140页 |
| 在读期间获奖情况 | 第140-142页 |
| 学位论文评阅及答辩情况表 | 第142-144页 |
| 外文论文 | 第144-161页 |