基于XML的Web数据挖掘技术的研究
| 摘要 | 第1-6页 |
| Abstract | 第6-10页 |
| 第1章 绪论 | 第10-16页 |
| ·研究背景及目的 | 第10-11页 |
| ·国内外研究现状 | 第11-14页 |
| ·Web数据挖掘 | 第11-13页 |
| ·XML文档聚类 | 第13-14页 |
| ·论文研究内容及组织 | 第14-16页 |
| ·论文研究内容 | 第14页 |
| ·论文的组织结构 | 第14-16页 |
| 第2章 相关知识及理论 | 第16-27页 |
| ·引言 | 第16页 |
| ·数据挖掘 | 第16-20页 |
| ·数据挖掘概述 | 第16-17页 |
| ·数据挖掘研究内容及常用技术 | 第17-19页 |
| ·数据挖掘流程 | 第19-20页 |
| ·Web数据挖掘 | 第20-23页 |
| ·Web数据挖掘概述 | 第20页 |
| ·Web数据挖掘分类 | 第20-22页 |
| ·Web数据挖掘基本过程 | 第22-23页 |
| ·XML技术 | 第23-26页 |
| ·XML概述 | 第23-24页 |
| ·XML的特点与优势 | 第24-25页 |
| ·XML在Web数据挖掘中的应用 | 第25-26页 |
| ·本章小结 | 第26-27页 |
| 第3章 基于扩展DOM树的Web对象数据抽取 | 第27-50页 |
| ·引言 | 第27-28页 |
| ·Web页面的预处理 | 第28-31页 |
| ·网页规范化 | 第28页 |
| ·构建DOM树 | 第28-29页 |
| ·使用基于树的核函数筛选相似页面 | 第29-31页 |
| ·Web页面特征 | 第31-34页 |
| ·网页标签特征 | 第31-32页 |
| ·网页视觉特征 | 第32-33页 |
| ·链接信息特征 | 第33-34页 |
| ·多个页面自动学习检测对象区域 | 第34-41页 |
| ·构建扩展DOM树 | 第34-36页 |
| ·多个相似页面对象区域检测算法 | 第36-41页 |
| ·从对象区域抽取对象数据 | 第41-46页 |
| ·区分数据项的角色 | 第41-43页 |
| ·对象数据抽取算法 | 第43-46页 |
| ·抽取结果输出为XML文档 | 第46页 |
| ·Web数据抽取实验 | 第46-49页 |
| ·Web数据抽取的评价标准 | 第46-47页 |
| ·实验结果及分析 | 第47-49页 |
| ·本章小结 | 第49-50页 |
| 第4章 基于树的层次相似度XML文档聚类方法 | 第50-64页 |
| ·引言 | 第50-51页 |
| ·XML文档层次结构 | 第51-55页 |
| ·XML文档的层次结构表示方法 | 第51-53页 |
| ·XML嵌套结构的处理 | 第53-55页 |
| ·基于树的层次相似度XML文档聚类方法 | 第55-60页 |
| ·XML文档的层次相似度计算 | 第55-59页 |
| ·基于层次相似度的XML文档聚类 | 第59-60页 |
| ·XML文档聚类实验 | 第60-63页 |
| ·聚类评价标准 | 第61-62页 |
| ·实验结果及分析 | 第62-63页 |
| ·本章小结 | 第63-64页 |
| 结论 | 第64-66页 |
| 参考文献 | 第66-71页 |
| 攻读硕士学位期间发表的论文及参加的项目 | 第71-72页 |
| 致谢 | 第72页 |