第一章 引言 | 第1-11页 |
·搜索引擎中的主题爬行器 | 第6-8页 |
·问题的提出 | 第8-9页 |
·相关工作及文章组织 | 第9-11页 |
第二章 面向主题的信息搜集 | 第11-24页 |
·通用爬行器 | 第11-14页 |
·主题爬行的基础假设和数据模型 | 第14-17页 |
·主题信息分布的局部性 | 第14-16页 |
·文本向量模型及其相似度评价 | 第16-17页 |
·主题爬行 | 第17-24页 |
·基于内容的主题爬行 | 第18-21页 |
·基于网络拓扑结构的网络爬行 | 第21-24页 |
第三章 分块主题爬行 | 第24-43页 |
·爬行工作的基本流程 | 第24-36页 |
·离线学习 | 第24-29页 |
·在线爬行 | 第29-36页 |
·页面的划分与合并方法 | 第36-43页 |
·页面划分算法 | 第36-39页 |
·内容块合并算法 | 第39-43页 |
第四章 系统实现和结果分析 | 第43-49页 |
·系统实现 | 第43-45页 |
·试验分析 | 第45-48页 |
·算法可能的改进 | 第48-49页 |
第五章 工作总结与展望 | 第49-51页 |
·工作总结 | 第49-50页 |
·工作展望 | 第50-51页 |
参考文献 | 第51-52页 |
摘要 | 第52-54页 |
Abstract | 第54-56页 |
致谢 | 第56-57页 |
导师及作者简介 | 第57页 |