基于树状XML文档语义相似度的研究
| 提要 | 第1-6页 |
| 第1章 绪论 | 第6-13页 |
| ·XML 简介 | 第6-7页 |
| ·研究背景 | 第7-8页 |
| ·XML 在 Web 数据挖掘中的应用 | 第8-9页 |
| ·XML 相似性比较的意义 | 第9-10页 |
| ·XML 数据的特点与相似度计算的关系 | 第10-11页 |
| ·本文研究的内容 | 第11-13页 |
| 第2章 算法研究 | 第13-30页 |
| ·提取XML 文档的有效结构 | 第13-15页 |
| ·根据文本相似度判断叶节点相似 | 第15-17页 |
| ·图方法判断相似度 | 第17-25页 |
| ·图方法简介 | 第17-18页 |
| ·树编辑距离算法原理 | 第18页 |
| ·基于树距离重复数据检测的算法 | 第18-21页 |
| ·对复杂的XML 树的一种BFS 处理方法 | 第21-23页 |
| ·深度优先搜索树法 | 第23-25页 |
| ·最小生成树 | 第25-28页 |
| ·基于DFS 方法的综合计算 | 第28-30页 |
| 第3章 实现与应用 | 第30-42页 |
| ·使用DOM4J 开发包 | 第30-31页 |
| ·DOM4J 的优缺点 | 第31页 |
| ·基于JAVA 实现 | 第31-40页 |
| ·实验应用 | 第40-42页 |
| 第4章 总结与展望 | 第42-43页 |
| 参考文献 | 第43-46页 |
| 致谢 | 第46-47页 |
| 摘要 | 第47-49页 |
| ABSTRACT | 第49-52页 |