首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

垂直搜索引擎中主题爬行技术的研究

摘要第1-5页
ABSTRACT第5-10页
1 绪论第10-17页
   ·主题爬行技术的研究背景及意义第10-12页
     ·垂直搜索引擎的提出第10页
     ·垂直搜索引擎与通用搜索引擎的区别第10-11页
     ·主题爬行技术的提出第11页
     ·主题爬行技术的研究意义第11-12页
   ·主题爬行技术的研究现状第12-14页
   ·本文的研究内容及组织结构第14-17页
     ·本文的研究内容第14-15页
     ·本文的组织结构第15-17页
2 主题爬行相关技术第17-28页
   ·引言第17页
   ·主题描述相关技术第17-20页
     ·主题表示模型第17-18页
     ·确定主题向量空间第18-19页
     ·主题特征加权第19-20页
   ·搜索策略第20-21页
   ·网页预处理相关技术第21-23页
     ·网页规范化第21页
     ·网页解析第21页
     ·网页分块第21-22页
     ·分词、去停用词第22-23页
   ·主题相关性计算中的相关技术第23-27页
     ·主题相关性的度量方法第23页
     ·基于 HowNet 的语义分析技术第23-24页
     ·基于 WordNet 的语义分析技术第24-25页
     ·基于 ODP 的语义分析技术第25-26页
     ·基于本体的语义分析技术第26-27页
   ·小结第27-28页
3 基于维基百科的主题描述第28-35页
   ·引言第28页
   ·主题描述的主要方法及存在问题第28-29页
   ·维基百科简介第29-31页
   ·基于维基百科的主题描述方法第31-34页
     ·扩充维基百科的分类树第31页
     ·构建主题向量第31-33页
     ·词语映射到概念过程中的消歧第33-34页
   ·小结第34-35页
4 基于网页分块的候选链接优先级的预测方法第35-44页
   ·引言第35页
   ·候选链接优先级预测的主要方法及存在问题第35-38页
   ·基于网页分块的候选链接优先级的预测方法第38-43页
     ·基于深度优先遍历的网页分块第38-40页
     ·候选链接的优先级预测第40-43页
   ·小结第43-44页
5 自适应的主题爬行策略第44-50页
   ·引言第44页
   ·自适应主题爬行策略的相关研究及存在问题第44-46页
   ·基于维基百科和网页分块的自适应的主题爬行器第46-47页
   ·基于信息增益的自适应方法第47-48页
     ·信息增益简介第47页
     ·基于信息增益的自适应方法第47-48页
   ·基于信息量总和比率的自适应方法第48-49页
   ·小结第49-50页
6 实验与分析第50-60页
   ·引言第50页
   ·主题爬行原型系统的实现第50-51页
   ·实验数据和参数设置第51-52页
     ·实验数据第51-52页
     ·参数设置第52页
   ·评价指标第52-53页
   ·实验方案第53-59页
     ·主题爬行策略的功能演进过程第53-54页
     ·主题描述方法的对比实验第54-55页
     ·主题描述详略程度对主题爬行性能的影响对比实验第55-57页
     ·引入网页分块前后的对比实验第57页
     ·不同的自适应方法之间的对比实验第57-59页
   ·小结第59-60页
7 总结与展望第60-63页
   ·本文总结第60-61页
   ·进一步的工作第61-63页
致谢第63-64页
参考文献第64-68页
附录第68页
 A. 作者在攻读硕士学位期间发表的论文目录第68页
 B. 作者在攻读硕士学位期间参与的科研项目第68页

论文共68页,点击 下载论文
上一篇:基于机器视觉的井下机车防撞系统研究
下一篇:Ice应用软件框架自动生成研究