首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于网页结构的Web信息提取系统的设计与实现

摘要第1-6页
Abstract第6-10页
第1章 绪论第10-16页
   ·课题背景及意义第10-12页
   ·本文的研究目标和解决的主要问题第12-14页
   ·本文的组织第14-16页
第2章 网页主题信息提取技术第16-24页
   ·相关研究工作第16-22页
     ·基于字符流的主题信息提取第16-17页
     ·利用页面的视觉特征找出主题第17-18页
     ·基于归纳的提取第18-19页
     ·分块模型第19-20页
     ·利用TABLE 标签找出页面主题第20-21页
     ·基于坐标的方法第21-22页
   ·本章小结第22-24页
第3章 主题信息提取系统的设计第24-42页
   ·设计目标第24-25页
   ·设计概要第25-27页
   ·STU-DOM 模型的设计第27-30页
     ·块(Block)第27-28页
     ·STU 和STU 模型第28页
     ·新的STU 树模型第28-29页
     ·新的STU-DOM 树模型第29-30页
   ·网页的解析第30-33页
   ·基于结构的过滤和分块第33-35页
   ·基于主题相关度的剪枝第35-38页
   ·优化策略第38-42页
     ·分块粒度的设计第39页
     ·虚词表的设计第39-40页
     ·关键词表的设计第40-41页
     ·权重的设计第41-42页
第4章 系统实现及实验分析第42-54页
   ·总体实现第42-44页
   ·数据接口的实现第44-45页
   ·系统配置的实现第45-46页
   ·实验结果第46-51页
   ·主题信息提取在网页分类中的应用第51-54页
     ·实验思想第51页
     ·评测标准第51-52页
     ·实验结果及结果分析第52-54页
第5章 总结与展望第54-55页
参考文献第55-58页
作者简介及在学期间所取得的科研成果第58-59页
致谢第59页

论文共59页,点击 下载论文
上一篇:面向Web安全的漏洞检测系统的研究与实现
下一篇:吉林省建设银行系统办公专网的网络和网络信任体系的研究与设计