首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--一般性问题论文--理论、方法论文--算法理论论文

一种模式发现算法及其Web信息抽取应用

摘要第1-4页
Abstract第4-6页
目录第6-8页
1 绪论第8-12页
   ·选题背景第8页
   ·国内外相关技术发展与研究现状第8-10页
   ·本论文的主要研究内容第10页
   ·论文结构安排第10-12页
2 Web信息抽取技术概述第12-17页
   ·Web信息抽取技术第12页
   ·Web信息抽取分类第12-15页
   ·信息抽取技术的主要任务第15-17页
3 相关技术第17-27页
   ·HTML(Hyper Text Markup Language)第17-19页
   ·XML第19-20页
   ·XHTML第20-21页
   ·DOM(Document Object Model)第21-22页
   ·XPath(XML Path Language)第22-23页
   ·HTTP超文本传输协议第23-24页
   ·代理第24-25页
   ·HTTPClient第25-27页
4 模式发现算法和抽取规则获取第27-49页
   ·模式发现的经典算法第27-32页
   ·后缀树和后缀树算法第32-36页
   ·重复模式发现算法第36-43页
   ·HTML页面重复模式发现的过程第43-45页
   ·信息抽取规则第45-48页
   ·实验分析第48-49页
5 陶瓷行业商品信息抽取系统第49-65页
   ·抽取器的整体设计第49-50页
   ·抽取的流程第50页
   ·Web浏览器第50-51页
   ·抽取规则产生模块第51-52页
   ·网络蜘蛛模块第52-56页
   ·数据抽取模块第56-57页
   ·数据集成模块第57-61页
   ·系统配置和管理模块第61-65页
6 总结与展望第65-67页
   ·研究成果第65页
   ·创新点第65-66页
   ·存在的不足及今后进一步研究内容第66-67页
致谢第67-68页
参考文献第68-71页
附录A:硕士期间发表的论文第71页

论文共71页,点击 下载论文
上一篇:面向制造业的ASP服务平台安全解决方案
下一篇:一种基于领域本体的语义检索方法研究