基于XML的Web数据挖掘技术的研究

摘要	第1-6页
Abstract	第6-10页
第1章绪论	第10-16页
·研究背景及目的	第10-11页
·国内外研究现状	第11-14页
·Web数据挖掘	第11-13页
·XML文档聚类	第13-14页
·论文研究内容及组织	第14-16页
·论文研究内容	第14页
·论文的组织结构	第14-16页
第2章相关知识及理论	第16-27页
·引言	第16页
·数据挖掘	第16-20页
·数据挖掘概述	第16-17页
·数据挖掘研究内容及常用技术	第17-19页
·数据挖掘流程	第19-20页
·Web数据挖掘	第20-23页
·Web数据挖掘概述	第20页
·Web数据挖掘分类	第20-22页
·Web数据挖掘基本过程	第22-23页
·XML技术	第23-26页
·XML概述	第23-24页
·XML的特点与优势	第24-25页
·XML在Web数据挖掘中的应用	第25-26页
·本章小结	第26-27页
第3章基于扩展DOM树的Web对象数据抽取	第27-50页
·引言	第27-28页
·Web页面的预处理	第28-31页
·网页规范化	第28页
·构建DOM树	第28-29页
·使用基于树的核函数筛选相似页面	第29-31页
·Web页面特征	第31-34页
·网页标签特征	第31-32页
·网页视觉特征	第32-33页
·链接信息特征	第33-34页
·多个页面自动学习检测对象区域	第34-41页
·构建扩展DOM树	第34-36页
·多个相似页面对象区域检测算法	第36-41页
·从对象区域抽取对象数据	第41-46页
·区分数据项的角色	第41-43页
·对象数据抽取算法	第43-46页
·抽取结果输出为XML文档	第46页
·Web数据抽取实验	第46-49页
·Web数据抽取的评价标准	第46-47页
·实验结果及分析	第47-49页
·本章小结	第49-50页
第4章基于树的层次相似度XML文档聚类方法	第50-64页
·引言	第50-51页
·XML文档层次结构	第51-55页
·XML文档的层次结构表示方法	第51-53页
·XML嵌套结构的处理	第53-55页
·基于树的层次相似度XML文档聚类方法	第55-60页
·XML文档的层次相似度计算	第55-59页
·基于层次相似度的XML文档聚类	第59-60页
·XML文档聚类实验	第60-63页
·聚类评价标准	第61-62页
·实验结果及分析	第62-63页
·本章小结	第63-64页
结论	第64-66页
参考文献	第66-71页
攻读硕士学位期间发表的论文及参加的项目	第71-72页
致谢	第72页