首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于优化NFA正则匹配的Web信息抽取技术及应用研究

摘要第1-6页
ABSTRACT第6-9页
第一章 绪论第9-13页
   ·课题研究背景与意义第9页
   ·国内外研究现状第9-11页
     ·Web信息抽取技术第9-10页
     ·Web挖掘分类第10-11页
     ·Web开发技术第11页
   ·研究内容第11-12页
   ·论文组织结构第12-13页
第二章 相关技术研究第13-24页
   ·常用Web信息抽取方法第13-14页
   ·正则表达式第14-18页
     ·正则表达式术语第14-15页
     ·基于NFA的正则表达式匹配算法第15-16页
     ·基于DFA的正则表达式匹配算法第16-17页
     ·两种正则表达式匹配算法的比较第17-18页
   ·Web信息抽取开发框架第18-23页
     ·Ext Js框架第18-19页
     ·Spring框架第19-22页
     ·Hibernate框架第22-23页
   ·本章小结第23-24页
第三章 NFA优化第24-32页
   ·Thompson构造NFA第24-25页
   ·减少构建时间第25-27页
     ·扩展构建第25-26页
     ·表压缩第26-27页
     ·缓存技术第27页
   ·存储空间压缩第27-28页
   ·NFA引擎下正则表达式的优化第28-30页
   ·实验性能分析第30-31页
   ·本章小结第31-32页
第四章 Web信息抽取第32-43页
   ·获取Web服务器的页面第32-33页
   ·网页预处理第33-36页
     ·编码识别第33-34页
     ·基于模板的网页去噪算法第34-36页
   ·基于表达式优化的抽取规则第36-39页
     ·抽取原理第36-37页
     ·规则生成第37-39页
   ·Web信息抽取开发框架集成第39-42页
     ·三层框架的整合第39-41页
     ·IoC技术和AOP思想第41-42页
   ·本章小结第42-43页
第五章 Web房屋数据抽取系统的设计与实现第43-59页
   ·系统总体架构第43-45页
   ·数据库模块第45-46页
   ·网页预处理模块第46-47页
   ·改进的NFA正则表达式匹配模块第47-48页
   ·系统各个功能模块的实现第48-56页
     ·站点维护第49-50页
     ·采集和导航规则第50-51页
     ·任务管理模块第51-52页
     ·数据抽取的实现第52-56页
   ·系统测试第56-58页
   ·本章小结第58-59页
第六章 总结和展望第59-61页
   ·本文研究工作的总结第59页
   ·工作展望第59-61页
致谢第61-62页
参考文献第62-66页
附录第66-67页
详细摘要第67-68页

论文共68页,点击 下载论文
上一篇:基于规则集的正则表达式匹配算法研究
下一篇:硅压阻式压力传感器的封装研究