首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于频繁路径特征的XML文档结构聚类算法研究与实现

提要第1-7页
第1章 绪论第7-11页
   ·XML与数据挖掘第7-8页
   ·XML文档结构聚类第8-9页
   ·本文工作第9-11页
第2章 结构数据抽取第11-30页
   ·常见路径序列挖掘第11-21页
     ·术语定义第11-13页
     ·经典的Apriori算法第13-16页
     ·通用的GSP算法第16-18页
     ·快速PrefixSpan算法第18-21页
   ·聚类第21-30页
     ·数据表征第23-24页
     ·常用聚类策略第24-25页
     ·层次聚类方法第25-26页
     ·基于划分的聚类方法第26-30页
第3章 XML数据处理第30-35页
   ·XML文档的结构定义第30-32页
   ·新型XML数据第32-33页
   ·XML数据信息抽取第33-35页
第4章 PBClustering算法第35-44页
   ·XML文档预处理第35-36页
   ·挖掘文档间频繁路径第36-39页
     ·术语定义第36-37页
     ·XML频繁路径挖掘过程第37-39页
   ·XML文档聚类第39-40页
   ·算法改进第40-42页
     ·原算法存在的问题第40页
     ·文档相似度计算第40页
     ·路径长度权重第40-41页
     ·提高算法的可伸缩性第41-42页
   ·算法示例第42-44页
第5章 对比实验第44-46页
   ·文档间相似度计算第44页
   ·路径加权第44-45页
   ·适合大数据集的高效算法第45-46页
第6章 结论与展望第46-47页
参考文献第47-49页
致谢第49-50页
摘要第50-52页
Abstract第52-54页

论文共54页,点击 下载论文
上一篇:基于.Net平台多层应用程序开发框架的设计与实现
下一篇:基于网络的个人健康医疗服务平台的研发