基于树状XML文档语义相似度的研究

提要	第1-6页
第1章绪论	第6-13页
·XML 简介	第6-7页
·研究背景	第7-8页
·XML 在 Web 数据挖掘中的应用	第8-9页
·XML 相似性比较的意义	第9-10页
·XML 数据的特点与相似度计算的关系	第10-11页
·本文研究的内容	第11-13页
第2章算法研究	第13-30页
·提取XML 文档的有效结构	第13-15页
·根据文本相似度判断叶节点相似	第15-17页
·图方法判断相似度	第17-25页
·图方法简介	第17-18页
·树编辑距离算法原理	第18页
·基于树距离重复数据检测的算法	第18-21页
·对复杂的XML 树的一种BFS 处理方法	第21-23页
·深度优先搜索树法	第23-25页
·最小生成树	第25-28页
·基于DFS 方法的综合计算	第28-30页
第3章实现与应用	第30-42页
·使用DOM4J 开发包	第30-31页
·DOM4J 的优缺点	第31页
·基于JAVA 实现	第31-40页
·实验应用	第40-42页
第4章总结与展望	第42-43页
参考文献	第43-46页
致谢	第46-47页
摘要	第47-49页
ABSTRACT	第49-52页