首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

面向主题的爬行搜索策略研究与实现

目录第1-5页
摘要第5-6页
Abstract第6-8页
第一章 绪论第8-16页
   ·主题爬行研究的研究背景和重要意义第8-10页
   ·主题爬行国内外研究现状第10-14页
     ·主题爬行研究内容第11-13页
     ·具有代表性的系统第13-14页
   ·论文结构第14-16页
第二章 主题爬行研究综述第16-22页
   ·通用爬虫研究第16-18页
     ·通用爬虫的工作流程第16-18页
     ·网络爬虫搜索策略第18页
   ·主题爬行技术综述第18-22页
     ·主题爬行的概念第18-20页
     ·主题爬行系统的基本原理第20-22页
第三章 主题爬虫关键技术研究第22-32页
   ·Web文本分类技术第22-25页
     ·Web文本预处理第22-23页
     ·文本表示第23-24页
     ·文本分类算法第24-25页
   ·主题相似度的计算方法第25-27页
       ·特征项选择第26页
     ·特征项赋权第26-27页
   ·主题爬行策略第27-32页
     ·基于文字内容的启发策略第27-28页
     ·基于超链接结构分析法第28-32页
第四章 面向主题的爬行策略研究第32-48页
   ·主题爬行架构第32-33页
   ·LDA主题模型提取关键词第33-37页
     ·LDA介绍第34-35页
     ·LDA主题模型结果分析第35-37页
   ·Naive Bayes分类器的设计第37-42页
     ·Naive Bayes分类器原理介绍第37-38页
     ·分类器代码分析第38-40页
     ·分类器性能分析第40-42页
   ·基于WebLech的主题爬虫系统实现第42-48页
     ·WebLech介绍第42页
     ·WebLech特点分析第42-43页
     ·WebLech体系结构及其工作原理分析第43-44页
     ·改进后的Weblech第44-46页
     ·系统性能分析第46-48页
第五章 总结与展望第48-50页
参考文献第50-53页
致谢第53-54页
攻读硕士学位期间的研究成果第54页

论文共54页,点击 下载论文
上一篇:掌纹识别算法研究
下一篇:基于扩展时延Petri网的Web服务组合建模及性能分析