首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

垂直搜索引擎的主题网页抓取策略研究

摘要第1-5页
Abstract第5-9页
1 绪论第9-15页
   ·研究背景及意义第9-10页
   ·国内外研究现状第10-12页
   ·论文的主要工作第12-13页
   ·论文的组织结构第13-15页
2 搜索引擎概述与信息检索模型第15-25页
   ·搜索引擎的发展历程第15-16页
   ·搜索引擎的分类第16-17页
   ·搜索引擎的工作原理第17-19页
   ·垂直搜索引擎第19-20页
     ·垂直搜索引擎产生的原因第19-20页
     ·垂直搜索引擎与通用搜索引擎的区别第20页
   ·信息检索模型第20-23页
     ·布尔模型第20-21页
     ·贝叶斯方法第21-22页
     ·向量空间模型第22-23页
   ·本章小结第23-25页
3 主题网页抓取策略研究第25-37页
   ·主题网页抓取技术第25-27页
     ·网页抓取技术的定义第25页
     ·主题网页抓取技术的定义第25页
     ·主题网页抓取技术的工作原理第25-26页
     ·主题网页抓取技术拟解决的关键问题第26-27页
   ·主题描述与主题网页分布特性第27-30页
     ·主题描述第27-28页
     ·主题网页的分布特性第28-29页
     ·主题上下文图第29-30页
   ·主题网页抓取的主要策略第30-35页
     ·基于文字内容的启发式方法第30-32页
     ·基于 Web 超链图评价的方法第32-34页
     ·基于分类器预测的方法第34页
     ·其他主题爬行的方法第34-35页
   ·各种主题抓取技术的优缺点第35-36页
   ·本章小结第36-37页
4 基于 HMM 的主题网页抓取策略第37-51页
   ·马尔可夫过程和马尔可夫链第37-39页
   ·HMM 的定义第39-40页
   ·HMM 的基本问题第40-43页
     ·评估问题第41页
     ·解码问题第41-42页
     ·学习问题第42-43页
   ·HMM 在主题网页抓取中的应用第43-46页
     ·基于 HMM 的主题网页抓取策略提出的背景第43-44页
     ·基于 HMM 的主题网页抓取策略的组成第44页
     ·基于 HMM 的主题网页抓取的基本思想第44-46页
   ·模块的具体实现第46-50页
     ·用户浏览模式学习模块第47-48页
     ·主题爬行模块第48-50页
   ·本章小结第50-51页
5 基于 HMM 主题网页抓取策略的改进第51-59页
   ·HMM 主题网页抓取策略的缺点第51页
   ·HMM 主题网页抓取策略的改进第51-54页
     ·特征词权重计算方法的改进第51-53页
     ·URL 优先值计算方法的改进第53-54页
   ·爬行程序的实现第54-55页
   ·改进算法的性能分析第55-57页
   ·本章小结第57-59页
6 总结与展望第59-61页
   ·总结第59页
   ·展望第59-61页
致谢第61-63页
参考文献第63-65页
附录 1(攻读学位期间发表论文目录)第65页

论文共65页,点击 下载论文
上一篇:无线传感器网络LEACH路由算法的研究及应用
下一篇:数字图像纹理提取的理论研究及应用