基于多特征的Web社区发现关键技术研究
| 摘要 | 第1-6页 |
| ABSTRACT | 第6-10页 |
| 第一章 绪论 | 第10-19页 |
| ·研究背景 | 第10-11页 |
| ·研究现状 | 第11-15页 |
| ·基于结构挖掘的社区发现方法 | 第12-14页 |
| ·基于内容挖掘的社区发现方法 | 第14-15页 |
| ·论文工作 | 第15-18页 |
| ·论文的主要结构 | 第18-19页 |
| 第二章 基于结构与内容特征结合的页面内容提取算法 | 第19-44页 |
| ·前言 | 第19-20页 |
| ·VIPS算法 | 第20-29页 |
| ·DOM模型 | 第20-21页 |
| ·VIPPS算法特点 | 第21-23页 |
| ·VIPS算法描述 | 第23-29页 |
| ·一种基于页面内容特征与结构特征的内容提取算法 | 第29-37页 |
| ·算法的整体描述 | 第29-30页 |
| ·基于块的Web页面描述 | 第30-31页 |
| ·页面分块 | 第31-36页 |
| ·主题块与主题相关块的确定 | 第36-37页 |
| ·实验 | 第37-43页 |
| ·小结 | 第43-44页 |
| 第三章 基于互信息的“软”聚类集成 | 第44-64页 |
| ·前言 | 第44-45页 |
| ·聚类集成 | 第45-47页 |
| ·信息论基础 | 第47-49页 |
| ·Strehl的聚类集成目标函数 | 第49-50页 |
| ·基于互信息的聚类集成算法 | 第50-54页 |
| ·基于差异度的加权聚类集成算法 | 第54-57页 |
| ·差异度的衡量 | 第54-56页 |
| ·基于差异度的加权互信息聚类集成算法 | 第56-57页 |
| ·实验描述 | 第57-63页 |
| ·本章小结 | 第63-64页 |
| 第四章 基于多视图聚类的Web社区发现 | 第64-88页 |
| ·前言 | 第64-65页 |
| ·信息瓶颈算法 | 第65-67页 |
| ·多视图学习 | 第67-69页 |
| ·基于多视图的信息瓶颈算法 | 第69-76页 |
| ·基于多视图的信息瓶颈目标函数 | 第69-73页 |
| ·目标函数求解 | 第73-75页 |
| ·全局聚类集成 | 第75-76页 |
| ·基于多视图的Web社区发现算法 | 第76-80页 |
| ·向量空间模型 | 第76-77页 |
| ·Web页面多视图特征集的选择 | 第77-79页 |
| ·算法实现 | 第79-80页 |
| ·实验描述 | 第80-86页 |
| ·实验数据集描述 | 第80-81页 |
| ·评价标准 | 第81-82页 |
| ·参数的选择 | 第82-84页 |
| ·MVIB中的聚类集成算法的选择 | 第84页 |
| ·与单视图信息瓶颈算法和聚类集成算法比较 | 第84-85页 |
| ·Web页面多视图的选择 | 第85-86页 |
| ·小结 | 第86-88页 |
| 第五章 基于主题社区的检索模型 | 第88-102页 |
| ·引言 | 第88-89页 |
| ·基于社区的信息检索模型 | 第89-101页 |
| ·总体架构 | 第89-91页 |
| ·主题社区模型生成 | 第91-95页 |
| ·社区匹配函数 | 第95-96页 |
| ·模型的检索特点 | 第96-101页 |
| ·模型的应用 | 第101页 |
| ·小结 | 第101-102页 |
| 第六章 结论与展望 | 第102-104页 |
| ·总结 | 第102-103页 |
| ·展望 | 第103-104页 |
| 参考文献 | 第104-117页 |
| 致谢 | 第117-118页 |
| 攻读学位期间主要的研究成果 | 第118页 |