提要 | 第1-7页 |
第1章 绪 论 | 第7-12页 |
·研究背景和意义 | 第7页 |
·搜索引擎研究现状 | 第7-9页 |
·主题爬行的提出 | 第9页 |
·主题爬行策略研究现状 | 第9-10页 |
·本文的工作及组织结构 | 第10-12页 |
第2章 主题爬行和语义WEB相关技术介绍 | 第12-20页 |
·主题爬行策略原理 | 第12-14页 |
·主题爬行策略的研究 | 第14-16页 |
·基于网页文档内容分析的方法 | 第14页 |
·基于链接分析的方法 | 第14-15页 |
·其他研究方法 | 第15-16页 |
·文本处理技术 | 第16-17页 |
·将语义WEB技术应用到主题爬行的研究 | 第17-20页 |
·语义Web框架 | 第17-18页 |
·本体的介绍 | 第18-19页 |
·本体的形式化定义 | 第19-20页 |
第3章 网页综合信息与领域本体相结合的主题爬行策略 | 第20-33页 |
·文档特征向量位置信息与本体语义结合计算主题相关度 | 第20-24页 |
·文档特征项位置对主题相关度影响 | 第20-21页 |
·领域本体对主题爬行的影响 | 第21-23页 |
·特征项位置与本体语义结合计算主题相关度 | 第23-24页 |
·综合锚文本信息与本体语义预测子链接主题相关度 | 第24-30页 |
·锚文本对预测URL主题相关度的影响 | 第24-26页 |
·URL链接关系对预测主题相关度的影响 | 第26-28页 |
·锚文本信息与URL链接关系预测URL主题相关度算法 | 第28-30页 |
·网页综合信息与领域本体结合的主题爬行策略 | 第30-33页 |
第4章 主题爬虫系统设计与功能实现 | 第33-42页 |
·系统结构和流程 | 第33-36页 |
·系统框架和主要功能模块介绍 | 第33-34页 |
·爬行流程介绍 | 第34-36页 |
·核心功能模块介绍 | 第36-40页 |
·构建领域本体指导主题爬行 | 第40页 |
·系统开发工具 | 第40-42页 |
第5章 实验设计与分析 | 第42-46页 |
·实验说明 | 第42-43页 |
·数据集 | 第42页 |
·实验评价标准 | 第42-43页 |
·实验数据分析 | 第43-45页 |
·实验结论 | 第45-46页 |
第6章 工作总结与展望 | 第46-48页 |
·工作总结 | 第46页 |
·未来前景展望 | 第46-48页 |
参考文献 | 第48-51页 |
致谢 | 第51-52页 |
摘要 | 第52-54页 |
Abstract | 第54-56页 |