基于网页结构的Web信息提取系统的设计与实现

摘要	第1-6页
Abstract	第6-10页
第1章绪论	第10-16页
·课题背景及意义	第10-12页
·本文的研究目标和解决的主要问题	第12-14页
·本文的组织	第14-16页
第2章网页主题信息提取技术	第16-24页
·相关研究工作	第16-22页
·基于字符流的主题信息提取	第16-17页
·利用页面的视觉特征找出主题	第17-18页
·基于归纳的提取	第18-19页
·分块模型	第19-20页
·利用TABLE 标签找出页面主题	第20-21页
·基于坐标的方法	第21-22页
·本章小结	第22-24页
第3章主题信息提取系统的设计	第24-42页
·设计目标	第24-25页
·设计概要	第25-27页
·STU-DOM 模型的设计	第27-30页
·块（Block）	第27-28页
·STU 和STU 模型	第28页
·新的STU 树模型	第28-29页
·新的STU-DOM 树模型	第29-30页
·网页的解析	第30-33页
·基于结构的过滤和分块	第33-35页
·基于主题相关度的剪枝	第35-38页
·优化策略	第38-42页
·分块粒度的设计	第39页
·虚词表的设计	第39-40页
·关键词表的设计	第40-41页
·权重的设计	第41-42页
第4章系统实现及实验分析	第42-54页
·总体实现	第42-44页
·数据接口的实现	第44-45页
·系统配置的实现	第45-46页
·实验结果	第46-51页
·主题信息提取在网页分类中的应用	第51-54页
·实验思想	第51页
·评测标准	第51-52页
·实验结果及结果分析	第52-54页
第5章总结与展望	第54-55页
参考文献	第55-58页
作者简介及在学期间所取得的科研成果	第58-59页
致谢	第59页