首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于文本相似度的局部Web社区识别技术

摘要第1-5页
Abstract第5-9页
1 绪论第9-14页
   ·研究背景第9-11页
   ·论文的主要研究工作第11-13页
   ·论文组织第13-14页
2 Web信息检索基础知识第14-27页
   ·信息检索介绍第14-17页
     ·信息检索与数据检索第14页
     ·信息检索的发展第14-15页
     ·文档的逻辑视图第15-16页
     ·检索过程第16-17页
   ·向量空间模型第17-20页
     ·信息检索模型的形式第17-18页
     ·向量空间第18-19页
     ·相关性第19-20页
   ·搜索引擎第20-25页
     ·搜索引擎的工作原理第20-21页
     ·搜索引擎的分类第21-22页
     ·搜索引擎中的排序算法第22-24页
     ·Web上典型的搜索任务第24-25页
   ·信息检索评价指标第25-27页
     ·准确率与召回率第25-26页
     ·平均准确率与平均召回率第26-27页
3 Web链接结构与社区发现第27-33页
   ·Web链接结构第27-28页
     ·Web链接图第27页
     ·Web链接结构的自组织性第27-28页
     ·Web链接分析第28页
   ·社区发现第28-33页
     ·社区定义第29-30页
     ·传统复杂网络中的社区发现算法第30页
     ·Web社区发现算法第30-33页
4 最大流社区识别算法回顾与分析第33-42页
   ·最大流最小割第33-35页
   ·FLG算法第35-39页
     ·理想社区第35-36页
     ·近似社区第36-38页
     ·预期最大化算法第38-39页
   ·算法分析第39-42页
     ·社区体积与边的关系第39-40页
     ·FLG算法存在的问题及IK方法的提出第40-42页
5 对最大流算法的改进:基于文本相似度的社区识别算法第42-51页
   ·改进的总体思路第42页
   ·从页面框架到站点框架的聚合算法第42-44页
   ·邻域图基于文本相似度的加权策略第44-49页
     ·方法概述第44-45页
     ·邻接图结点(即Web网页)主题的向量表示第45页
     ·社区主题(即FLG种子集主题)的向量表示第45-46页
     ·计算结点的主题相似度第46-47页
     ·基于文本相似度的边容量设置第47-48页
     ·迭代后结点的排序策略第48-49页
   ·基于文本相似度的社区识别算法第49-51页
     ·结合内容与链接分析的社区识别算法步骤第49页
     ·页面/站点邻接图构造第49-51页
6 实验第51-64页
   ·实验设计准则第51页
   ·Web实验第51-58页
     ·实验方案第51-52页
     ·数据集的爬取及预处理第52-54页
     ·系统结构第54-57页
     ·系统详细设计第57-58页
   ·实验结果及其讨论第58-63页
   ·实验总结第63-64页
结论第64-65页
参考文献第65-67页
附录A 非用字(stop words list)第67-68页
附录B 基于预流推进与最短增广路径策略实现最大流算法第68-75页
攻读硕士学位期间发表学术论文情况第75-76页
致谢第76-78页

论文共78页,点击 下载论文
上一篇:基于多模态粒子群优化的社会网络分析研究
下一篇:信息物理系统的安全访问控制机制