首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于语义DOM的WEB信息抽取

摘要第1-4页
Abstract第4-6页
目录第6-9页
1. 绪论第9-14页
   ·选题背景和研究意义第9页
   ·信息抽取技术的发展历史第9-11页
   ·国内外研究状况第11-12页
   ·本文主要工作第12页
   ·论文结构第12-14页
2. Web挖掘技术综述第14-23页
   ·数据挖掘第14-15页
     ·数据挖掘的概念第14页
     ·数据挖掘的常用技术第14-15页
     ·WEB数据挖掘概念第15页
   ·DOM定义第15-19页
     ·DOM应用第16-17页
     ·DOM标准中的四个基本接口第17-19页
   ·XHTML技术第19-20页
     ·XHTML定义第19页
     ·XHTML特点第19页
     ·XHTML与HTML差异第19-20页
   ·语义化第20-22页
     ·语义标签定义第20页
     ·语义标签作用第20页
     ·语义标签实践第20-21页
     ·标签的意义第21-22页
   ·本章小结第22-23页
3. 基于Web页面模板规则提取第23-27页
   ·Web页面模板相关研究第23-24页
   ·模板特征的提取规则第24-25页
   ·模板特征抽取算法第25-26页
   ·实验与结果分析第26页
     ·实验第26页
     ·结果分析第26页
   ·本章小结第26-27页
4. 基于Dom树的Web信息提取第27-31页
   ·Web信息提取的几种方法介绍第27页
     ·基于分块的Web信息提取第27页
     ·基于HTML代码密度的正文提取方法第27页
     ·基于FFT的网页正文提取方法第27页
   ·相关定义第27-28页
   ·节点文本统计第28-29页
   ·节点加权筛选第29-30页
   ·实验与结果分析第30页
     ·实验第30页
     ·结果分析第30页
   ·本章小结第30-31页
5. 基于语义dom的web信息抽取第31-39页
   ·基于语义dom抽取的体系结构第31-33页
     ·系统内部实现原理第31页
     ·系统工作流程第31-33页
   ·网页数据标准化第33页
   ·HTML转换为XHTML第33-37页
     ·DOM树构造器概述第33-34页
     ·DOM树构造器原理第34-35页
     ·语义分析器与剪枝器第35-37页
   ·实验与结果分析第37-38页
     ·实验开发工具和平台第37-38页
     ·实验第38页
     ·结果分析第38页
   ·本章小结第38-39页
6. 结论和展望第39-41页
   ·论文工作总结第39页
   ·下一步工作第39-41页
参考文献第41-45页
攻读硕士学位期间的科研成果第45-46页
致谢第46-47页

论文共47页,点击 下载论文
上一篇:广州市华侨新村地区城市形态演变及动因研究
下一篇:基于领域本体和句框架的主观题自动阅卷算法研究