基于优化NFA正则匹配的Web信息抽取技术及应用研究

摘要	第1-6页
ABSTRACT	第6-9页
第一章绪论	第9-13页
·课题研究背景与意义	第9页
·国内外研究现状	第9-11页
·Web信息抽取技术	第9-10页
·Web挖掘分类	第10-11页
·Web开发技术	第11页
·研究内容	第11-12页
·论文组织结构	第12-13页
第二章相关技术研究	第13-24页
·常用Web信息抽取方法	第13-14页
·正则表达式	第14-18页
·正则表达式术语	第14-15页
·基于NFA的正则表达式匹配算法	第15-16页
·基于DFA的正则表达式匹配算法	第16-17页
·两种正则表达式匹配算法的比较	第17-18页
·Web信息抽取开发框架	第18-23页
·Ext Js框架	第18-19页
·Spring框架	第19-22页
·Hibernate框架	第22-23页
·本章小结	第23-24页
第三章 NFA优化	第24-32页
·Thompson构造NFA	第24-25页
·减少构建时间	第25-27页
·扩展构建	第25-26页
·表压缩	第26-27页
·缓存技术	第27页
·存储空间压缩	第27-28页
·NFA引擎下正则表达式的优化	第28-30页
·实验性能分析	第30-31页
·本章小结	第31-32页
第四章 Web信息抽取	第32-43页
·获取Web服务器的页面	第32-33页
·网页预处理	第33-36页
·编码识别	第33-34页
·基于模板的网页去噪算法	第34-36页
·基于表达式优化的抽取规则	第36-39页
·抽取原理	第36-37页
·规则生成	第37-39页
·Web信息抽取开发框架集成	第39-42页
·三层框架的整合	第39-41页
·IoC技术和AOP思想	第41-42页
·本章小结	第42-43页
第五章 Web房屋数据抽取系统的设计与实现	第43-59页
·系统总体架构	第43-45页
·数据库模块	第45-46页
·网页预处理模块	第46-47页
·改进的NFA正则表达式匹配模块	第47-48页
·系统各个功能模块的实现	第48-56页
·站点维护	第49-50页
·采集和导航规则	第50-51页
·任务管理模块	第51-52页
·数据抽取的实现	第52-56页
·系统测试	第56-58页
·本章小结	第58-59页
第六章总结和展望	第59-61页
·本文研究工作的总结	第59页
·工作展望	第59-61页
致谢	第61-62页
参考文献	第62-66页
附录	第66-67页
详细摘要	第67-68页