首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

半结构化Web信息抽取研究

摘要第1-6页
Abstract第6-9页
第1章 绪论第9-14页
   ·课题的研究背景及意义第9-10页
   ·国内外研究现状第10-12页
   ·研究内容及论文结构第12-14页
第2章 相关技术第14-34页
   ·数据挖掘技术第14-17页
     ·数据挖掘概念第14-15页
     ·数据挖掘功能第15-17页
     ·数据挖掘分类第17页
   ·信息抽取技术第17-25页
     ·信息抽取的定义及特点第18页
     ·信息抽取的分类第18-22页
     ·信息抽取的模型第22-24页
     ·抽取规则描述语言第24-25页
   ·XML技术第25-28页
     ·XML文档简介第25-26页
     ·XML的文档结构第26-27页
     ·XML特点第27-28页
   ·DOM、XPath与XSLT第28-33页
     ·DOM第29-30页
     ·XPath第30-32页
     ·XSLT第32-33页
   ·本章小结第33-34页
第3章 信息抽取的研究目标与流程设计第34-38页
   ·信息抽取存在的问题第34-35页
   ·基于规则的信息抽取方法基本思路第35页
   ·信息抽取的流程第35-36页
   ·抽取规则的表示第36-37页
   ·本章小结第37-38页
第4章 基于Web的半结构化信息抽取方法第38-53页
   ·数据预处理第39-44页
     ·页面文档的清洗第40-42页
     ·DOM树的构造第42-44页
   ·抽取规则第44-49页
     ·基于JTree的DOM树显示算法第44-46页
     ·基于DOM的XPath生成算法第46-47页
     ·抽取规则生成第47-49页
   ·信息抽取第49-50页
   ·实验分析及结论第50-51页
   ·本章小结第51-53页
结论第53-55页
参考文献第55-60页
攻读硕士学位期间发表的论文和取得的科研成果第60-61页
致谢第61页

论文共61页,点击 下载论文
上一篇:基于网格的MST数据流聚类算法研究
下一篇:基于模糊小波神经网络的软件可靠性增长模型的研究