首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于DOM的Web信息抽取技术的研究与实现

摘要第1-5页
Abstract第5-9页
1 绪论第9-12页
   ·选题背景和研究意义第9页
   ·国内外现状综述第9-11页
   ·论文研究内容与结构安排第11-12页
2 Web信息抽取第12-19页
   ·Web信息抽取概述第12-13页
   ·Web信息抽取分类第13-17页
   ·Web信息抽取的应用第17-18页
   ·信息抽取系统的评价指标第18页
   ·本章小结第18-19页
3 信息抽取相关技术第19-27页
   ·HTML第19-20页
   ·XML第20-24页
   ·WAP与 WML第24页
   ·XPath第24-25页
   ·正则表达式第25-26页
   ·本章小结第26-27页
4 基于DOM的 Web信息抽取方法第27-48页
   ·获取相似页面第27-32页
     ·相似页面的作用第27页
     ·获取 URL第27-28页
     ·基于 URL结构比较法第28-30页
     ·简单树匹配比较法第30-32页
   ·总体抽取过程描述第32-34页
   ·HTML文档的预处理第34-36页
     ·清洗 HTML文档第34-36页
     ·XML文档的解析第36页
   ·采用特征比较法进行信息抽取第36-39页
     ·特征的选择与提取第36-38页
     ·相似度计算第38-39页
   ·针对多记录网页的信息抽取第39-45页
   ·实验结果与分析第45-47页
   ·本章小结第47-48页
5 信息抽取系统的设计与实现第48-57页
   ·设计目标第48页
   ·系统总体框架第48-52页
     ·功能模块设计第48-49页
     ·功能模块介绍第49-52页
   ·系统的实现第52-56页
     ·工作总览第52-53页
     ·系统操作界面第53-55页
     ·系统评价策略第55-56页
   ·本章小结第56-57页
结论第57-59页
参考文献第59-62页
攻读硕士学位期间发表学术论文情况第62-63页
致谢第63-64页

论文共64页,点击 下载论文
上一篇:HSTCP拥塞控制算法及其改进策略的研究
下一篇:基于FPGA的CAN/LIN协议转换网关的研究