嵌入分布信息的Web文档聚类算法研究

目录	第1-6页
图表索引	第6-7页
摘要	第7-8页
Abstract	第8-9页
第一章绪论	第9-13页
·本课题的研究意义和国内外现状	第9-11页
·研究意义	第9页
·国内外现状分析	第9-11页
·研究内容与主要工作	第11-12页
·本文的组织结构	第12-13页
第二章 Web文档挖掘的相关知识	第13-19页
·Web数据挖掘概述	第13-15页
·Web内容挖掘	第13-14页
·Web结构挖掘	第14-15页
·Web使用挖掘	第15页
·Web文档挖掘的相关内容	第15-16页
·Web文档挖掘的相关方法	第16-18页
·分类方法	第16页
·聚类方法	第16-17页
·关联分析	第17-18页
·小结	第18-19页
第三章嵌入分布信息的Web文档聚类算法	第19-31页
·引言	第19-21页
·Web页面的信息抽取及表示	第21-23页
·HTML文件简介	第21页
·文本表示	第21-22页
·特征项的抽取	第22-23页
·Web文档相似性度量	第23-25页
·经典的Web文档相似性度量	第23-24页
·嵌入分布信息的Web文档相似性度量	第24-25页
·不同相似性度量下的聚类和分类算法比较	第25-31页
·不同相似性度量下的Kmeans算法	第25-26页
·不同相似性度量下的KNN算法	第26页
·算法性能比较	第26-31页
第四章多角度策略下的半监督Web文档聚类算法研究	第31-41页
·引言	第31-32页
·co-training概述	第32-35页
·co-training方法简介	第32-34页
·co-training算法流程	第34-35页
·多角度策略下的Kmeans文档聚类算法	第35-38页
·传统的co-Kmeans算法	第35-36页
·结合Kmeans和KNN的多角度学习算法	第36-38页
·基于新相似性度量的多角度文档聚类	第38页
·实验结果分析	第38-41页
·数据集	第38-39页
·实验结果	第39-41页
第五章基于核的Web文档聚类算法研究	第41-53页
·核的相关概念	第41-42页
·基于多项式核的多角度Web文档聚类算法	第42-48页
·引言	第42-44页
·基于多项式核的co-Kmeans算法	第44-45页
·多项式核下的基于Kmeans和KNN的多角度学习算法	第45页
·实验结果分析	第45-48页
·基于高斯核的多角度Web文档聚类算法	第48-52页
·高斯函数的性质	第48-50页
·基于高斯核的多角度聚类算法	第50页
·实验结果分析	第50-52页
·小结	第52-53页
第六章总结	第53-54页
致谢	第54-55页
参考文献	第55-60页
附录读研期间发表(录用)论文情况	第60页