首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

面向领域的半结构化Web信息抽取技术

摘要第1-6页
Abstract第6-11页
1 绪论第11-20页
   ·选题背景和意义第11-12页
   ·信息抽取技术第12-18页
   ·本文研究内容与创新之处第18-19页
   ·本文的章节安排第19-20页
2 本文涉及的相关概念第20-29页
   ·领域关键词第20-21页
   ·HTML第21-23页
   ·XML第23-25页
   ·DOM树第25-26页
   ·正则表达式第26-28页
   ·本章小结第28-29页
3 面向特定领域半结构化文本 Web信息抽取系统的总体设计第29-35页
   ·特定领域的半结构化文本Web信息特征分析第29-32页
   ·系统的总体设计第32-34页
   ·系统开发平台第34页
   ·本章小结第34-35页
4 领域关键词词库的建立第35-50页
   ·领域关键词词库的建立流程第35-36页
   ·包装器的构建第36-39页
   ·网站搜索器的构建第39-46页
   ·领域关键词词库的创建第46-49页
   ·本章小结第49-50页
5 基于领域关键词词库的抽取规则自动生成技术第50-62页
   ·抽取规则的自动生成流程第50页
   ·将样本页面转化为DOM树第50-53页
   ·有效结点的提取算法第53-56页
   ·抽取规则自动归纳的实现第56-61页
   ·本章小结第61-62页
6 总结与展望第62-64页
致谢第64-65页
攻读硕士期间主要成果第65-66页
参考文献第66-69页

论文共69页,点击 下载论文
上一篇:关于Petri网汇合性质和家态的一些探讨
下一篇:基于DICOM3.0的医学图像的显示与处理研究