| 摘要 | 第1-7页 |
| Abstract | 第7-11页 |
| 第1章 绪论 | 第11-17页 |
| ·课题的研究背景及其意义 | 第11-12页 |
| ·国内外研究现状 | 第12-16页 |
| ·论文的主要工作与组织结构 | 第16-17页 |
| 第2章 XML与Web挖掘概述 | 第17-25页 |
| ·Web挖掘 | 第17-20页 |
| ·Web挖掘的分类 | 第17-18页 |
| ·Web挖掘的复杂性分析 | 第18-19页 |
| ·Web挖掘的基本过程 | 第19-20页 |
| ·XML概述 | 第20-25页 |
| ·XML产生的背景 | 第20-22页 |
| ·XML的主要特点 | 第22-23页 |
| ·XML在Web挖掘中的应用 | 第23-25页 |
| 第3章 一种基于DOM的HTML-XML转换模型及其实现 | 第25-37页 |
| ·HTML-XML转换 | 第25-27页 |
| ·HTML与XML的区别 | 第25-26页 |
| ·HTML-XML转换技术分析 | 第26-27页 |
| ·一种利用DOM和JTidy的HTML-XML转换模型的提出 | 第27-32页 |
| ·DOM与JTidy | 第27-30页 |
| ·转换模型 | 第30-31页 |
| ·转换步骤 | 第31-32页 |
| ·转换模型的实现与测试 | 第32-35页 |
| ·转换模型的实现 | 第32-34页 |
| ·转换测试 | 第34-35页 |
| ·本章小结 | 第35-37页 |
| 第4章 一种嵌入式频繁子树挖掘算法及其改进 | 第37-68页 |
| ·频繁子树挖掘相关概念 | 第37-41页 |
| ·树的定义与分类 | 第37-38页 |
| ·子树的分类 | 第38-40页 |
| ·树的表示形式 | 第40-41页 |
| ·频繁子树挖掘 | 第41页 |
| ·一种嵌入式频繁子树挖掘算法——TreeGrowth算法 | 第41-49页 |
| ·相关概念 | 第41-45页 |
| ·TreeGrowth算法思想 | 第45-48页 |
| ·TreeGrowth算法描述及分析 | 第48-49页 |
| ·基于拓扑投影对TreeGrowth算法的改进 | 第49-58页 |
| ·问题提出 | 第49-50页 |
| ·改进算法思想 | 第50-51页 |
| ·改进算法的描述 | 第51-58页 |
| ·算法的仿真分析 | 第58-66页 |
| ·算法实现的难点及解决方法 | 第58-61页 |
| ·算法运行结果 | 第61-62页 |
| ·性能分析与比较 | 第62-66页 |
| ·本章小结 | 第66-68页 |
| 结论与展望 | 第68-69页 |
| 致谢 | 第69-70页 |
| 参考文献 | 第70-76页 |
| 攻读硕士学位期间发表的论文 | 第76页 |