首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于PAT和MLN的Web数据抽取研究

摘要第1-4页
ABSTRACT第4-8页
1 绪论第8-12页
   ·课题研究背景及意义第8-9页
   ·国内外研究现状第9-10页
   ·本文主要工作第10-11页
   ·论文组织结构第11-12页
2 信息抽取知识概述第12-18页
   ·信息抽取简介第12-13页
   ·WEB 数据抽取技术概述第13-15页
   ·WEB 数据抽取技术分类第15-17页
   ·本章小结第17-18页
3 相关理论知识简介第18-31页
   ·PAT 简介第18-24页
     ·trie 树第18-19页
     ·半无限长字符串第19-20页
     ·PAT 树的结构第20-21页
     ·PAT 树的应用第21-24页
   ·马尔科夫逻辑网简介第24-30页
     ·马尔科夫网第24-25页
     ·一阶逻辑第25-26页
     ·马尔科夫逻辑网第26-28页
     ·MLN 中的权重学习第28-29页
     ·MLN 中的推理算法第29-30页
   ·本章小结第30-31页
4 基于 PAT 和 MLN 的 WEB 数据抽取方法第31-50页
   ·基本原理概述第31-32页
   ·页面预处理第32-37页
     ·页面整理第32-34页
     ·页面序列化第34-37页
   ·基于 PAT 的频繁模式发现第37-43页
     ·构建 PAT 树第37-38页
     ·模式发掘第38-40页
     ·模式筛选第40-43页
   ·基于 MLN 的数据抽取第43-48页
     ·基础谓词构建第43-45页
     ·逻辑公式构建第45-47页
     ·构建 MLN第47-48页
   ·数据存储第48-49页
   ·本章小结第49-50页
5 实验第50-60页
   ·数据集和实验环境第50页
   ·实验度量标准第50-51页
   ·实验方法第51页
   ·实验过程及结果分析第51-59页
     ·实验 1第51-56页
     ·实验 2第56-59页
   ·本章小结第59-60页
6 总结与展望第60-62页
   ·本文总结第60页
   ·展望第60-62页
致谢第62-63页
参考文献第63-66页
附录第66页
 A. 作者在攻读硕士学位期间发表的论文目录第66页

论文共66页,点击 下载论文
上一篇:复杂天气情况下的多车牌定位技术研究
下一篇:基于重复数据检测的网络差异备份系统研究