基于主题词同现图的网页相关度研究

摘要	第1-6页
Abstract	第6-10页
第一章绪论	第10-15页
·研究背景与意义	第10-11页
·网页相关度研究的主要任务	第11-12页
·网页相关度研究的历史与现状	第12-13页
·当前存在问题	第13页
·本文工作以及组织结构	第13-15页
第二章文本表示和特征选择	第15-20页
·中文分词	第15-17页
·基于字符串匹配的分词方法	第15页
·基于理解的分词算法	第15-16页
·基于统计的分词算法	第16-17页
·文本特征词选择	第17-19页
·本章小结	第19-20页
第三章主题词同现图	第20-27页
·图论和无向图	第20-22页
·图论背景	第20-21页
·图论的应用领域	第21-22页
·主题词的同现关系	第22页
·主题词同现图的定义和生成	第22-26页
·本章小结	第26-27页
第四章图的相关度计算概述	第27-40页
·图相似和图匹配	第27-28页
·图和子图同构	第28-29页
·图编辑距离	第29-30页
·最大共同子图和最小共同超图	第30-32页
·状态空间查找方法	第32-33页
·概率方法	第33-34页
·距离保存方法	第34-35页
·离散松弛算法	第35-37页
·图集合的均值和中值	第37-38页
·本章小结	第38-40页
第五章基于主题词同现图的K-MEANS聚类算法	第40-48页
·数据挖掘及其应用	第40-41页
·网页聚类	第41-42页
·K-MEANS聚类算法	第42-45页
·算法概述	第42-44页
·算法改进	第44-45页
·图编辑距离在主题词同现图上的应用	第45-46页
·本章小结	第46-48页
第六章实验结果与分析	第48-59页
·主题词同现图应用系统	第48-52页
·系统模块	第49-52页
·爬虫与正文提取模块在系统中的作用	第52页
·实验结果	第52-57页
·实验数据介绍	第52-53页
·数据特点描述	第53-55页
·实验评估方法	第55页
·数据统计及结果分析	第55-57页
·算法分析	第57-58页
·本章小结	第58-59页
总结与展望	第59-61页
参考文献	第61-65页
致谢	第65页