首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--软件工程论文

基于结构和视觉特征的网页信息抽取技术的研究与实现

摘要第1-4页
Abstract第4-5页
目录第5-8页
图目录第8-10页
表目录第10-11页
第1章 绪论第11-20页
   ·垂直搜索引擎技术的介绍第11-12页
   ·垂直搜索引擎的一般体系结构第12-14页
   ·垂直搜索引擎中涉及到的技术第14-18页
     ·页面分析技术第15页
     ·超链分析算法第15-17页
     ·网页信息的结构化抽取第17-18页
     ·暗藏网页的信息抽取第18页
   ·网页信息抽取技术在垂直搜索引擎系统中的地位第18-19页
   ·本章小结第19-20页
第2章 网页信息抽取的相关工作第20-32页
   ·网页信息抽取问题的描述第20-24页
     ·信息抽取和信息检索的区别第20-21页
     ·信息抽取的历史第21-22页
     ·网页信息抽取的形式化描述第22-23页
     ·信息抽取的例子第23-24页
   ·网页信息抽取对象的特点和难点第24-26页
   ·当前技术现状第26-31页
     ·按照主要技术手段分类第27-29页
     ·按照自动化程度分类第29-30页
     ·不同技术比较第30-31页
   ·当前不足第31页
   ·本章小结第31-32页
第3章 WIES网页信息抽取模块的体系结构第32-37页
   ·WIES网页信息抽取模块划分第32-35页
     ·输入处理子模块第32-34页
     ·网页数据记录定位子模块第34页
     ·网页数据记录对齐和属性提取子模块第34页
     ·数据输出入库子模块第34-35页
   ·WIES网页信息抽取模块的关联第35-36页
     ·输入处理子模块与数据记录定位子模块的交互第35-36页
     ·数据输出子模块与网页数据对齐和属性提取子模块的交互第36页
   ·本章小结第36-37页
第4章 网页数据记录定位模块第37-58页
   ·数据记录定位模块的算法设计第37-53页
     ·基本假设和概念定义第37-41页
     ·节点组合的生成第41-44页
     ·比较算法的选择第44-50页
     ·数据记录定位算法第50-53页
   ·自动化数据记录定位模块的实现第53-57页
     ·网页DOM树的建立第53-55页
     ·噪音的去除第55-56页
     ·视觉信息的运用第56页
     ·接口设计与实现第56-57页
   ·本章小结第57-58页
第5章 数据记录对齐数据提取模块第58-69页
   ·数据记录对齐和数据提取模块的算法设计第58-67页
     ·基本概念介绍第58-59页
     ·基本算法流程第59-67页
   ·数据记录对齐和数据提取模块的实现第67-68页
     ·模块类图第68页
   ·本章小结第68-69页
第6章 实验结果第69-77页
   ·DEMO第69-73页
   ·系统评测第73-76页
     ·数据说明第75页
     ·横向比较第75-76页
   ·本章小结第76-77页
第7章 结论与展望第77-79页
   ·本文完成的主要工作第77页
   ·本文的主要贡献和创新点第77页
   ·进一步的研究工作第77-79页
参考文献第79-83页
致谢第83-84页
作者简历第84页

论文共84页,点击 下载论文
上一篇:交易管理系统重构
下一篇:异构数字化系统互操作关键技术研究