半结构化Web信息抽取研究

摘要	第1-6页
Abstract	第6-9页
第1章绪论	第9-14页
·课题的研究背景及意义	第9-10页
·国内外研究现状	第10-12页
·研究内容及论文结构	第12-14页
第2章相关技术	第14-34页
·数据挖掘技术	第14-17页
·数据挖掘概念	第14-15页
·数据挖掘功能	第15-17页
·数据挖掘分类	第17页
·信息抽取技术	第17-25页
·信息抽取的定义及特点	第18页
·信息抽取的分类	第18-22页
·信息抽取的模型	第22-24页
·抽取规则描述语言	第24-25页
·XML技术	第25-28页
·XML文档简介	第25-26页
·XML的文档结构	第26-27页
·XML特点	第27-28页
·DOM、XPath与XSLT	第28-33页
·DOM	第29-30页
·XPath	第30-32页
·XSLT	第32-33页
·本章小结	第33-34页
第3章信息抽取的研究目标与流程设计	第34-38页
·信息抽取存在的问题	第34-35页
·基于规则的信息抽取方法基本思路	第35页
·信息抽取的流程	第35-36页
·抽取规则的表示	第36-37页
·本章小结	第37-38页
第4章基于Web的半结构化信息抽取方法	第38-53页
·数据预处理	第39-44页
·页面文档的清洗	第40-42页
·DOM树的构造	第42-44页
·抽取规则	第44-49页
·基于JTree的DOM树显示算法	第44-46页
·基于DOM的XPath生成算法	第46-47页
·抽取规则生成	第47-49页
·信息抽取	第49-50页
·实验分析及结论	第50-51页
·本章小结	第51-53页
结论	第53-55页
参考文献	第55-60页
攻读硕士学位期间发表的论文和取得的科研成果	第60-61页
致谢	第61页