首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

信息集成系统中面向领域的Web信息抽取研究

摘要第1-4页
Abstract第4-7页
第一章 绪论第7-13页
   ·研究背景第7-8页
   ·研究现状第8-10页
   ·论文的工作第10-13页
第二章 IIS信息集成系统第13-21页
   ·信息集成简介第13-15页
   ·IIS信息集成系统第15-17页
     ·系统结构第15-16页
     ·系统的主要模块第16-17页
   ·Web信息抽取子系统第17-21页
     ·信息集成中Web信息抽取面临的挑战第17-18页
     ·面向领域的Web抽取系统框架第18-21页
第三章 基于DOM的半结构抽取方法第21-39页
   ·相关技术第21-28页
     ·HTML第21-22页
     ·XML第22-25页
     ·XPath第25-28页
   ·基于DOM树映射的抽取方法第28-31页
     ·抽取规则建立的过程第28-30页
     ·映射规则自动创建第30-31页
     ·Web信息抽取的过程第31页
   ·抽取实验第31-34页
   ·抽取规则健壮性分析第34-36页
     ·基于DOM树路径第34-35页
     ·基于内容的定位第35页
     ·基于节点属性的定位第35-36页
   ·本章小结第36-39页
第四章 基于NLP的无结构抽取方法第39-49页
   ·相关技术第39-42页
     ·分词/分类第39-40页
     ·JNI的转换第40-41页
     ·语义距离计算第41-42页
   ·基于NLP的抽取方法第42-45页
     ·词条抽取规则第42-43页
     ·抽取约束规则第43-44页
     ·抽取算法第44-45页
   ·基于NLP的抽取实验第45-47页
   ·本章小结第47-49页
第五章 面向领域的Web信息抽取系统第49-65页
   ·抽取系统难点及目标第49页
     ·网页信息抽取的难点第49页
     ·网页信息抽取平台的目标第49页
   ·系统框架模块第49-51页
   ·详细工作流程第51-62页
     ·获取网页第51-53页
     ·页面信息块检测与提取第53-54页
     ·样本学习归纳规则第54-57页
     ·分词/分类处理第57-58页
     ·模板抽取规则生成第58页
     ·领域Ontology库建立与维护第58-60页
     ·Jena语义推导第60-61页
     ·半结构和无结构自适应提取第61-62页
   ·实验结果及结论第62-63页
   ·抽取规则的维护第63-65页
第六章 总结与展望第65-67页
致谢第67-69页
参考文献第69-73页
作者在读期间的科研成果第73页

论文共73页,点击 下载论文
上一篇:妇科腹腔镜术中不同T体位对呼吸动力学的影响
下一篇:颈胸结合部重建手术的临床分析