首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于遗传算法的主题爬虫搜索策略研究

摘要第1-5页
Abstract第5-6页
目录第6-8页
第1章 引言第8-14页
   ·背景第8页
   ·搜索引擎分类第8-10页
   ·国内外的发展概况第10-12页
   ·搜索引擎未来的发展第12页
   ·本文研究内容和创新点第12-13页
   ·本文结构安排第13-14页
第2章 相关研究内容第14-21页
   ·搜索引擎体系结构第14-17页
     ·下载系统第14-15页
     ·分析系统第15-16页
     ·索引系统第16页
     ·查询系统第16-17页
   ·网络爬虫的工作原理第17-18页
   ·网络爬虫的搜索策略第18-19页
   ·神经网络与遗传算法第19页
   ·主题爬虫的设计目标第19-20页
   ·本章小结第20-21页
第3章 主题爬虫的关键技术第21-33页
   ·不重复抓取网页策略第21-22页
   ·向量空间模型算法第22-24页
   ·主题爬虫的搜索策略分类第24-31页
     ·基于内容评价的搜索策略第24-26页
     ·基于链接结构评价的搜索策略第26-30页
     ·基于未来回报的搜索策略第30-31页
   ·正向最大匹配分词第31-32页
   ·本章小结第32-33页
第4章 基于遗传算法的主题爬虫的实现第33-43页
   ·构造初始群第33-37页
   ·交叉第37-38页
   ·变异第38-40页
   ·选择第40-41页
   ·终止搜索第41-42页
   ·本章小结第42-43页
第5章 性能分析第43-53页
   ·实验设计第43-47页
     ·实验目的第44页
     ·实验原理第44-46页
     ·VSM模块第46页
     ·Authority和Hub计算模块第46-47页
   ·实验过程第47-50页
     ·基于Best-First算法的实验过程第47-48页
     ·基于HITS算法的实验过程第48-49页
     ·基于GA算法的实验过程第49-50页
   ·实验结果分析第50-52页
   ·本章小结第52-53页
第6章 总结与展望第53-54页
   ·本文总结第53页
   ·研究展望第53-54页
参考文献第54-58页
致谢第58-59页
附录第59页

论文共59页,点击 下载论文
上一篇:信息安全风险评估量化模型的研究与应用
下一篇:基于内容的近似图像检测算法研究