网页多主题内容块的识别和提取

第一章绪论	第1-11页
·当前的网络资源搜索技术	第6-7页
·主题爬行技术简述	第7-10页
·本文的主要工作	第10-11页
第二章 DOM文档对象模型	第11-21页
·Html/xml语言	第11-12页
·DOM模型的定义	第12-14页
·DOM表示结构化文档的方式	第14-21页
第三章内容抽取的主要应用和成果	第21-28页
·应用VIPS方法的网页内容抽取	第21-24页
·Style tree	第24-28页
第四章基于DOM的内容块提取	第28-48页
·页面的初步过滤	第28-31页
·多主题和tunnel问题	第31-32页
·内容块的识别和提取	第32-38页
·算法描述	第38-40页
·实验结果	第40-46页
·基于内容块的网页内容预测	第46-47页
·内容块在用户返回结果上的应用	第47页
·总结	第47-48页
第五章未来的工作	第48-50页
·style树将来的作用	第48页
·网页中视觉要素的应用	第48-49页
·图片的处理	第49-50页
参考文献	第50-52页
中文摘要	第52-55页
Abstract	第55-58页
致谢	第58-59页
导师与作者简介	第59页