基于多特征的Web社区发现关键技术研究
摘要 | 第1-6页 |
ABSTRACT | 第6-10页 |
第一章 绪论 | 第10-19页 |
·研究背景 | 第10-11页 |
·研究现状 | 第11-15页 |
·基于结构挖掘的社区发现方法 | 第12-14页 |
·基于内容挖掘的社区发现方法 | 第14-15页 |
·论文工作 | 第15-18页 |
·论文的主要结构 | 第18-19页 |
第二章 基于结构与内容特征结合的页面内容提取算法 | 第19-44页 |
·前言 | 第19-20页 |
·VIPS算法 | 第20-29页 |
·DOM模型 | 第20-21页 |
·VIPPS算法特点 | 第21-23页 |
·VIPS算法描述 | 第23-29页 |
·一种基于页面内容特征与结构特征的内容提取算法 | 第29-37页 |
·算法的整体描述 | 第29-30页 |
·基于块的Web页面描述 | 第30-31页 |
·页面分块 | 第31-36页 |
·主题块与主题相关块的确定 | 第36-37页 |
·实验 | 第37-43页 |
·小结 | 第43-44页 |
第三章 基于互信息的“软”聚类集成 | 第44-64页 |
·前言 | 第44-45页 |
·聚类集成 | 第45-47页 |
·信息论基础 | 第47-49页 |
·Strehl的聚类集成目标函数 | 第49-50页 |
·基于互信息的聚类集成算法 | 第50-54页 |
·基于差异度的加权聚类集成算法 | 第54-57页 |
·差异度的衡量 | 第54-56页 |
·基于差异度的加权互信息聚类集成算法 | 第56-57页 |
·实验描述 | 第57-63页 |
·本章小结 | 第63-64页 |
第四章 基于多视图聚类的Web社区发现 | 第64-88页 |
·前言 | 第64-65页 |
·信息瓶颈算法 | 第65-67页 |
·多视图学习 | 第67-69页 |
·基于多视图的信息瓶颈算法 | 第69-76页 |
·基于多视图的信息瓶颈目标函数 | 第69-73页 |
·目标函数求解 | 第73-75页 |
·全局聚类集成 | 第75-76页 |
·基于多视图的Web社区发现算法 | 第76-80页 |
·向量空间模型 | 第76-77页 |
·Web页面多视图特征集的选择 | 第77-79页 |
·算法实现 | 第79-80页 |
·实验描述 | 第80-86页 |
·实验数据集描述 | 第80-81页 |
·评价标准 | 第81-82页 |
·参数的选择 | 第82-84页 |
·MVIB中的聚类集成算法的选择 | 第84页 |
·与单视图信息瓶颈算法和聚类集成算法比较 | 第84-85页 |
·Web页面多视图的选择 | 第85-86页 |
·小结 | 第86-88页 |
第五章 基于主题社区的检索模型 | 第88-102页 |
·引言 | 第88-89页 |
·基于社区的信息检索模型 | 第89-101页 |
·总体架构 | 第89-91页 |
·主题社区模型生成 | 第91-95页 |
·社区匹配函数 | 第95-96页 |
·模型的检索特点 | 第96-101页 |
·模型的应用 | 第101页 |
·小结 | 第101-102页 |
第六章 结论与展望 | 第102-104页 |
·总结 | 第102-103页 |
·展望 | 第103-104页 |
参考文献 | 第104-117页 |
致谢 | 第117-118页 |
攻读学位期间主要的研究成果 | 第118页 |