第一章 绪论 | 第1-11页 |
·当前的网络资源搜索技术 | 第6-7页 |
·主题爬行技术简述 | 第7-10页 |
·本文的主要工作 | 第10-11页 |
第二章 DOM文档对象模型 | 第11-21页 |
·Html/xml语言 | 第11-12页 |
·DOM模型的定义 | 第12-14页 |
·DOM表示结构化文档的方式 | 第14-21页 |
第三章 内容抽取的主要应用和成果 | 第21-28页 |
·应用VIPS方法的网页内容抽取 | 第21-24页 |
·Style tree | 第24-28页 |
第四章 基于DOM的内容块提取 | 第28-48页 |
·页面的初步过滤 | 第28-31页 |
·多主题和tunnel问题 | 第31-32页 |
·内容块的识别和提取 | 第32-38页 |
·算法描述 | 第38-40页 |
·实验结果 | 第40-46页 |
·基于内容块的网页内容预测 | 第46-47页 |
·内容块在用户返回结果上的应用 | 第47页 |
·总结 | 第47-48页 |
第五章 未来的工作 | 第48-50页 |
·style树将来的作用 | 第48页 |
·网页中视觉要素的应用 | 第48-49页 |
·图片的处理 | 第49-50页 |
参考文献 | 第50-52页 |
中文摘要 | 第52-55页 |
Abstract | 第55-58页 |
致谢 | 第58-59页 |
导师与作者简介 | 第59页 |