基于网页结构的Web信息提取系统的设计与实现
摘要 | 第1-6页 |
Abstract | 第6-10页 |
第1章 绪论 | 第10-16页 |
·课题背景及意义 | 第10-12页 |
·本文的研究目标和解决的主要问题 | 第12-14页 |
·本文的组织 | 第14-16页 |
第2章 网页主题信息提取技术 | 第16-24页 |
·相关研究工作 | 第16-22页 |
·基于字符流的主题信息提取 | 第16-17页 |
·利用页面的视觉特征找出主题 | 第17-18页 |
·基于归纳的提取 | 第18-19页 |
·分块模型 | 第19-20页 |
·利用TABLE 标签找出页面主题 | 第20-21页 |
·基于坐标的方法 | 第21-22页 |
·本章小结 | 第22-24页 |
第3章 主题信息提取系统的设计 | 第24-42页 |
·设计目标 | 第24-25页 |
·设计概要 | 第25-27页 |
·STU-DOM 模型的设计 | 第27-30页 |
·块(Block) | 第27-28页 |
·STU 和STU 模型 | 第28页 |
·新的STU 树模型 | 第28-29页 |
·新的STU-DOM 树模型 | 第29-30页 |
·网页的解析 | 第30-33页 |
·基于结构的过滤和分块 | 第33-35页 |
·基于主题相关度的剪枝 | 第35-38页 |
·优化策略 | 第38-42页 |
·分块粒度的设计 | 第39页 |
·虚词表的设计 | 第39-40页 |
·关键词表的设计 | 第40-41页 |
·权重的设计 | 第41-42页 |
第4章 系统实现及实验分析 | 第42-54页 |
·总体实现 | 第42-44页 |
·数据接口的实现 | 第44-45页 |
·系统配置的实现 | 第45-46页 |
·实验结果 | 第46-51页 |
·主题信息提取在网页分类中的应用 | 第51-54页 |
·实验思想 | 第51页 |
·评测标准 | 第51-52页 |
·实验结果及结果分析 | 第52-54页 |
第5章 总结与展望 | 第54-55页 |
参考文献 | 第55-58页 |
作者简介及在学期间所取得的科研成果 | 第58-59页 |
致谢 | 第59页 |