首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于非常快速退火搜索算法的主题爬虫研究与实现

摘要第1-3页
ABSTRACT第3-8页
第一章 绪论第8-12页
   ·研究背景和意义第8-9页
   ·国内外相关研究现状第9页
   ·论文的主要研究内容和结构安排第9-10页
     ·主要研究内容第9-10页
     ·论文结构安排第10页
   ·论文的研究成果与创新第10-12页
第二章 主题爬虫的原理及关键技术第12-19页
   ·通用型爬虫第12-14页
     ·页面采集模块第12-14页
     ·页面预处理模块第14页
     ·链接提取模块第14页
     ·数据库存储模块第14页
   ·主题爬虫的工作原理第14-15页
   ·主题爬虫的结构模型第15-16页
   ·主题爬虫的关键技术第16-18页
     ·搜索策略第16-17页
     ·网页预处理第17页
     ·主题过滤第17-18页
     ·礼貌爬行问题第18页
   ·本章小结第18-19页
第三章 主题搜索策略第19-29页
   ·模拟退火算法原理第19-21页
     ·模拟退火算法的物理基础第20页
     ·Metropolis 准则第20-21页
   ·模拟退火算法结构第21-23页
   ·模拟退火算法的关键参数设置第23-26页
     ·状态产生函数第23页
     ·初始温度T_0 的选择第23-24页
     ·Metropolis 抽样稳定准则第24页
     ·温度下降函数的选取原则第24-25页
     ·结束准则的选取第25-26页
   ·非常快速模拟退火算法第26-27页
     ·问题的提出第26-27页
     ·非常快速模拟退火相关描述第27页
   ·本章小结第27-29页
第四章 网页预处理第29-40页
   ·网页解析第29-31页
     ·HTML 语法分析第29-30页
     ·页面中链接的提取第30页
     ·页面中正文提取第30-31页
   ·礼貌爬行第31-32页
     ·网络机器人排斥标准第31页
     ·网络机器人元标记第31-32页
   ·主题相关性判别第32-39页
     ·基于元数据的判别第33页
     ·基于链接标签数据的判别第33-34页
     ·基于链接结构分析的判断第34-36页
     ·基于页面语义信息的判定第36-39页
   ·本章小结第39-40页
第五章 主题爬虫的设计第40-53页
   ·爬虫的性能指标第40页
   ·爬虫设计原则及结构第40-41页
   ·关键设计点第41-50页
     ·种子页面的选取第41-42页
     ·网页信息提取第42-44页
     ·页面解析第44页
     ·链接价值的计算第44-46页
     ·页面主题相关性判断第46页
     ·搜索策略的选择第46-50页
   ·爬虫的运行流程第50-51页
   ·本章小结第51-53页
第六章 实现及结果数据第53-59页
   ·系统的实现第53-56页
     ·实验系统软件设计说明第53-54页
     ·主要类的介绍说明第54-55页
     ·主要数据表的说明第55-56页
   ·性能分析和比较第56-58页
   ·本章小结第58-59页
第七章 总结和展望第59-61页
   ·总结第59页
   ·展望第59-61页
参考文献第61-63页
致谢第63-64页
个人简历和在学期间发表的学术论文与研究成果第64-65页

论文共65页,点击 下载论文
上一篇:语义Web环境下基于本体的语义检索应用研究
下一篇:基于秘密共享的小波域联合数字水印算法研究