| 提要 | 第1-7页 |
| 第1章 绪 论 | 第7-12页 |
| ·研究背景和意义 | 第7页 |
| ·搜索引擎研究现状 | 第7-9页 |
| ·主题爬行的提出 | 第9页 |
| ·主题爬行策略研究现状 | 第9-10页 |
| ·本文的工作及组织结构 | 第10-12页 |
| 第2章 主题爬行和语义WEB相关技术介绍 | 第12-20页 |
| ·主题爬行策略原理 | 第12-14页 |
| ·主题爬行策略的研究 | 第14-16页 |
| ·基于网页文档内容分析的方法 | 第14页 |
| ·基于链接分析的方法 | 第14-15页 |
| ·其他研究方法 | 第15-16页 |
| ·文本处理技术 | 第16-17页 |
| ·将语义WEB技术应用到主题爬行的研究 | 第17-20页 |
| ·语义Web框架 | 第17-18页 |
| ·本体的介绍 | 第18-19页 |
| ·本体的形式化定义 | 第19-20页 |
| 第3章 网页综合信息与领域本体相结合的主题爬行策略 | 第20-33页 |
| ·文档特征向量位置信息与本体语义结合计算主题相关度 | 第20-24页 |
| ·文档特征项位置对主题相关度影响 | 第20-21页 |
| ·领域本体对主题爬行的影响 | 第21-23页 |
| ·特征项位置与本体语义结合计算主题相关度 | 第23-24页 |
| ·综合锚文本信息与本体语义预测子链接主题相关度 | 第24-30页 |
| ·锚文本对预测URL主题相关度的影响 | 第24-26页 |
| ·URL链接关系对预测主题相关度的影响 | 第26-28页 |
| ·锚文本信息与URL链接关系预测URL主题相关度算法 | 第28-30页 |
| ·网页综合信息与领域本体结合的主题爬行策略 | 第30-33页 |
| 第4章 主题爬虫系统设计与功能实现 | 第33-42页 |
| ·系统结构和流程 | 第33-36页 |
| ·系统框架和主要功能模块介绍 | 第33-34页 |
| ·爬行流程介绍 | 第34-36页 |
| ·核心功能模块介绍 | 第36-40页 |
| ·构建领域本体指导主题爬行 | 第40页 |
| ·系统开发工具 | 第40-42页 |
| 第5章 实验设计与分析 | 第42-46页 |
| ·实验说明 | 第42-43页 |
| ·数据集 | 第42页 |
| ·实验评价标准 | 第42-43页 |
| ·实验数据分析 | 第43-45页 |
| ·实验结论 | 第45-46页 |
| 第6章 工作总结与展望 | 第46-48页 |
| ·工作总结 | 第46页 |
| ·未来前景展望 | 第46-48页 |
| 参考文献 | 第48-51页 |
| 致谢 | 第51-52页 |
| 摘要 | 第52-54页 |
| Abstract | 第54-56页 |