首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

结构化信息抽取—半自动化包装器的研究与应用

摘要第1-5页
Abstract第5-8页
第一章 绪论第8-13页
   ·结构化信息抽取的发展背景第8-9页
   ·国内外研究状况第9-10页
     ·国外研究状况第9页
     ·国内研究状况第9-10页
   ·研究的意义和目的第10页
     ·研究的意义第10页
     ·研究的目的第10页
   ·当今技术分类及面临的主要问题第10-11页
   ·论文工作相关说明第11-12页
   ·本章小结第12-13页
第二章 基于列表页的Web 结构化信息抽取算法的研究及改进第13-26页
   ·列表页Web 页面介绍第13-14页
   ·列表页数据抽取过程及算法的研究第14-24页
     ·DOM 树的建立第14-16页
     ·有关列表页数据记录的观察结果第16-17页
     ·数据区域的挖掘第17-20页
     ·数据记录的识别第20-21页
     ·抽取模式生成第21-24页
   ·本章小结第24-26页
第三章 基于详情页的Web 结构化信息抽取算法的研究及改进第26-35页
   ·详情页Web 页面介绍第26-27页
   ·详情页数据的抽取过程及算法研究第27-34页
     ·结构化数据模型及HTML 标记编码规则定义第27-29页
     ·网页建模第29-30页
     ·抽取算法第30-34页
   ·本章小结第34-35页
第四章 实验结果展示第35-39页
   ·相关技术介绍第35-36页
     ·Java 语言第35页
     ·htmlparser第35-36页
   ·列表页形式的Web 页面的实验抽取结果第36-37页
   ·详情页形式的Web 页面抽取结果第37-39页
第五章 结论及技术展望第39-41页
   ·论文的总结第39页
   ·未来工作展望第39-41页
参考文献第41-43页
作者简介第43页
作者在攻读硕士学位期间发表的学术论文第43-44页
致谢第44-45页

论文共45页,点击 下载论文
上一篇:基于K-medoids聚类算法Web信息集成方法的研究与实现
下一篇:厨房污染物扩散规律研究与动态模拟软件开发