Web数据抽取技术研究

摘要	第1-6页
Abstract	第6-9页
第1章绪论	第9-14页
·研究背景及目的	第9-10页
·国内外研究现状	第10-12页
·论文研究内容及组织	第12-14页
·论文研究内容	第12-13页
·论文的组织结构	第13-14页
第2章相关知识及理论	第14-26页
·引言	第14页
·Web数据挖掘与数据抽取	第14-17页
·Web数据挖掘	第14-16页
·Web页面数据抽取	第16-17页
·Wrapper归纳	第17-20页
·自动抽取技术	第20-23页
·XML相关知识	第23-25页
·本章小结	第25-26页
第3章基于 DOM树的Web页面数据对象识别	第26-52页
·引言	第26-27页
·数据抽取的基本流程	第27-28页
·DOM树解析与扩展	第28-31页
·树的距离与匹配	第31-38页
·树的距离计算	第31-35页
·树的匹配算法	第35-38页
·网页聚类	第38-41页
·数据区域和记录识别	第41-48页
·数据区域识别	第41-47页
·数据记录识别	第47-48页
·Web页面数据抽取实验	第48-51页
·Web页面数据抽取的评价标准	第48-49页
·实验结果及分析	第49-51页
·本章小结	第51-52页
第4章基于抽取模式的Web页面数据抽取	第52-59页
·引言	第52-53页
·生成抽取模式树	第53-55页
·抽取数据对象	第55-57页
·实验结果分析	第57-58页
·本章小结	第58-59页
结论	第59-61页
参考文献	第61-66页
攻读硕士学位期间发表的论文及参加的项目	第66-67页
致谢	第67页