基于XML的Web数据挖掘技术的研究
摘要 | 第1-6页 |
Abstract | 第6-10页 |
第1章 绪论 | 第10-16页 |
·研究背景及目的 | 第10-11页 |
·国内外研究现状 | 第11-14页 |
·Web数据挖掘 | 第11-13页 |
·XML文档聚类 | 第13-14页 |
·论文研究内容及组织 | 第14-16页 |
·论文研究内容 | 第14页 |
·论文的组织结构 | 第14-16页 |
第2章 相关知识及理论 | 第16-27页 |
·引言 | 第16页 |
·数据挖掘 | 第16-20页 |
·数据挖掘概述 | 第16-17页 |
·数据挖掘研究内容及常用技术 | 第17-19页 |
·数据挖掘流程 | 第19-20页 |
·Web数据挖掘 | 第20-23页 |
·Web数据挖掘概述 | 第20页 |
·Web数据挖掘分类 | 第20-22页 |
·Web数据挖掘基本过程 | 第22-23页 |
·XML技术 | 第23-26页 |
·XML概述 | 第23-24页 |
·XML的特点与优势 | 第24-25页 |
·XML在Web数据挖掘中的应用 | 第25-26页 |
·本章小结 | 第26-27页 |
第3章 基于扩展DOM树的Web对象数据抽取 | 第27-50页 |
·引言 | 第27-28页 |
·Web页面的预处理 | 第28-31页 |
·网页规范化 | 第28页 |
·构建DOM树 | 第28-29页 |
·使用基于树的核函数筛选相似页面 | 第29-31页 |
·Web页面特征 | 第31-34页 |
·网页标签特征 | 第31-32页 |
·网页视觉特征 | 第32-33页 |
·链接信息特征 | 第33-34页 |
·多个页面自动学习检测对象区域 | 第34-41页 |
·构建扩展DOM树 | 第34-36页 |
·多个相似页面对象区域检测算法 | 第36-41页 |
·从对象区域抽取对象数据 | 第41-46页 |
·区分数据项的角色 | 第41-43页 |
·对象数据抽取算法 | 第43-46页 |
·抽取结果输出为XML文档 | 第46页 |
·Web数据抽取实验 | 第46-49页 |
·Web数据抽取的评价标准 | 第46-47页 |
·实验结果及分析 | 第47-49页 |
·本章小结 | 第49-50页 |
第4章 基于树的层次相似度XML文档聚类方法 | 第50-64页 |
·引言 | 第50-51页 |
·XML文档层次结构 | 第51-55页 |
·XML文档的层次结构表示方法 | 第51-53页 |
·XML嵌套结构的处理 | 第53-55页 |
·基于树的层次相似度XML文档聚类方法 | 第55-60页 |
·XML文档的层次相似度计算 | 第55-59页 |
·基于层次相似度的XML文档聚类 | 第59-60页 |
·XML文档聚类实验 | 第60-63页 |
·聚类评价标准 | 第61-62页 |
·实验结果及分析 | 第62-63页 |
·本章小结 | 第63-64页 |
结论 | 第64-66页 |
参考文献 | 第66-71页 |
攻读硕士学位期间发表的论文及参加的项目 | 第71-72页 |
致谢 | 第72页 |