首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于领域关键词自动扩展的变量主题Hopfield聚焦爬虫的研究

摘要第1-4页
ABSTRACT第4-8页
第一章 绪论第8-13页
   ·研究背景与意义第8-9页
   ·国内外研究现状第9-11页
   ·论文主要研究内容第11-12页
   ·论文结构第12-13页
第二章 聚焦爬虫技术第13-22页
   ·聚焦爬虫的基本概念第13-14页
   ·聚焦爬虫的基本原理第14-15页
   ·聚焦爬虫的基本框架第15-21页
     ·基本系统Focused Crawler第15-16页
     ·基于机器学习的Intelligent Crawler第16-17页
     ·基于神经网络的Hopfield Net Spider第17-19页
     ·基于层次结构的Focused site crawler第19-21页
   ·小结第21-22页
第三章 基于领域关键词自动扩展的变量主题HOPFIELD聚焦爬虫参考模型第22-33页
   ·变量主题聚焦爬虫必须解决的两个核心问题第22-23页
   ·基于领域关键词自动扩展的变量主题Hopfield聚焦爬虫参考模型第23-27页
     ·主题特征动态生成问题的解决策略第23-24页
     ·系统抓取准确性问题的解决策略第24-27页
     ·参考模型的提出第27页
   ·参考模型的具体描述第27-31页
     ·模型的需求分析第28页
     ·模型的空间维描述——系统体系结构第28-30页
     ·模型的时间维描述——工作流程第30-31页
   ·小结第31-33页
第四章 基于领域关键词自动扩展的变量主题HOPFIELD聚焦爬虫关键技术第33-54页
   ·领域关键词自动扩展关键技术第33-42页
     ·改进的页面表示模型DocView-a第33-38页
     ·改进的网页关键词提取算法HTTE-a第38-41页
     ·算法性能测试第41-42页
   ·面向HopfieldWeb模型的综合结构预测相关性分析模型HWRM第42-46页
     ·模型的基本思想第43页
     ·网页相关性计算第43-45页
     ·相关性模型HWRM的分析第45-46页
   ·基于Hopfield神经网络的URL搜索算法HNcrawl第46-53页
     ·基本思想第47-49页
     ·算法描述第49-53页
   ·小结第53-54页
第五章 系统设计与实验第54-64页
   ·系统设计第54-59页
     ·数据库设计第54-55页
     ·相关类设计第55-57页
     ·原型系统介绍第57-59页
   ·系统实验第59-62页
     ·性能评价指标第59-61页
     ·系统实验第61-62页
   ·基本结论第62-63页
   ·小结第63-64页
第六章 总结与展望第64-67页
   ·全文总结第64-65页
   ·未来的方向第65-67页
参考文献第67-72页
致谢第72-73页
攻读硕士学位期间的主要研究成果第73-74页
附录1 分词程序第74-75页
附录2 网页解析程序第75-79页
附录3 相关性分析程序第79页
附录4 神经网络迭代程序第79-82页
附录5 神经网络传播程序第82-83页

论文共83页,点击 下载论文
上一篇:智能组卷系统的研究与实现
下一篇:基于多代理的自动协商软件框架研究