首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

结合内容与链接分析搜索特定主题的权威Web信息源

中文摘要第1-7页
第一章 绪论第7-12页
 1.1 研究背景第7-8页
 1.2 研究目标第8-9页
 1.3 研究内容第9-11页
 1.4 论文结构第11-12页
第二章 Web信息检索基础知识第12-26页
 2.1 信息检索介绍第12-15页
  2.1.1 信息检索与数据检索第12-13页
  2.1.2 信息检索的发展第13页
  2.1.3 文档的逻辑视图第13-14页
  2.1.4 检索过程第14-15页
 2.2 向量空间模型第15-21页
  2.2.1 信息检索模型的形式化描述第16页
  2.2.2 向量空间第16-17页
  2.2.3 权重第17-18页
  2.2.4 相关性第18页
  2.2.5 相关性的进一步讨论第18-21页
 2.3 搜索引擎第21-24页
  2.3.1 搜索引擎的工作原理第21-22页
  2.3.2 搜索引擎的分类第22-23页
  2.3.3 搜索引擎中的排序算法第23-24页
  2.3.4 Web上典型的搜索任务第24页
 2.4 信息检索效果评价第24-26页
  2.4.1 准确率与召回率第24-25页
  2.4.2 平均准确率与平均召回率第25-26页
第三章 Web链接结构与主题精选第26-32页
 3.1 Web链接结构第26-28页
  3.1.1 Web链接图第26页
  3.1.2 Web链接结构的自组织性第26-27页
  3.1.3 链接分析第27-28页
 3.2 主题精选第28-30页
  3.2.1 宽主题查询第28-29页
  3.2.2 主题精选概念第29页
  3.2.3 主题精选及基于链接分析的元算法第29-30页
 3.3 TKC与TKC效应第30-32页
第四章 HITS算法回顾与评价第32-36页
 4.1 构造页面邻域图第32页
 4.2 迭代式链接分析第32-34页
 4.3 评价与分析第34-36页
第五章 对HITS算法的改进:g-HITSc算法第36-47页
 5.1 改进的总体思路第36页
 5.2 从页面粒度到站点粒度的聚合算法第36-38页
 5.3 邻域图结点基于内容分析加权和修剪第38-42页
  5.3.1 方法概述第38-39页
  5.3.2 邻域图结点主题的向量表示第39页
  5.3.3 查询主题的向量表示第39-40页
  5.3.4 计算结点的主题相关度权重第40-41页
  5.3.5 确定修剪结点/边的权重阈值第41页
  5.3.6 基于内容分析的结点加权算法第41-42页
 5.4 结合内容与链接分析的多粒度主题精选算法g-HITSc第42-45页
  5.4.1 页面/站点邻域图构造第42页
  5.4.2 加权迭代的理论分析第42-44页
  5.4.3 权重控制主题偏移有效性的进一步分析第44-45页
 5.5 g-HITSc算法小结第45-47页
  5.5.1 站点粒度主题精选第45-46页
  5.5.2 控制主题偏移第46页
  5.5.3 算法应用第46-47页
第六章 实验第47-61页
 6.1 Web实验第47-52页
  6.1.1 实验方案第47页
  6.1.2 原型系统实现介绍第47-52页
 6.2 实验结果及其讨论第52-58页
  6.2.1 实验结果第53-57页
  6.2.2 控制主题偏移有效性的讨论第57-58页
 6.3 控制主题偏移的模拟实验第58-59页
 6.4 实验总结第59-61页
第七章 总结与展望第61-62页
致谢第62-63页
参考文献第63-66页
附录第66-72页

论文共72页,点击 下载论文
上一篇:集成GIS/GPS的分布式SCADA软件设计
下一篇:智能住宅安全监控系统