首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

主题爬虫算法的研究与实现

摘要第1-5页
Abstract第5-9页
1 绪论第9-15页
   ·课题的研究背景及意义第9-10页
   ·国内外研究状况第10-13页
     ·主题相关度判定的研究状况第10-11页
     ·主题爬虫搜索策略的研究状况第11-13页
   ·本文研究的主要内容和文章结构第13-15页
2 搜索引擎和主题爬虫第15-21页
   ·搜索引擎简介第15-17页
   ·主题爬虫第17-20页
   ·本章小结第20-21页
3 主题爬虫的技术原理第21-30页
   ·互联网上主题页面分布特征第21页
   ·URL和正则表达式第21-23页
     ·URL简介第21-22页
     ·正则表达式第22-23页
   ·网页获取第23-24页
   ·网页内容分析第24-28页
     ·噪音清理第24页
     ·中文分词技术第24-25页
     ·向量空间模型第25-26页
     ·PageRank算法第26页
     ·HITS算法第26-28页
   ·网页去重和更新第28-29页
     ·网页去重第28-29页
     ·网页更新第29页
   ·本章小结第29-30页
4 主题爬虫相关算法研究与改进第30-41页
   ·主题相关性算法第30-34页
     ·VSM算法的研究现状第30-31页
     ·基于整个页面的VSM算法改进第31-34页
   ·改进的主题爬虫搜索策略第34-40页
     ·改进的遗传算法第35-38页
     ·模拟退火算法(SA)第38-39页
     ·基于改进的模拟退火遗传算法的主题搜索策略第39-40页
   ·本章小结第40-41页
5 爬虫关键技术的实现和算法改进实验第41-54页
   ·澳洲建筑商服务系统中主题爬虫的实现第41-48页
     ·澳洲建筑服务商系统简介第41页
     ·系统开发环境第41-42页
     ·澳洲建筑商服务系统中的主题爬虫的实现第42-48页
   ·算法改进实验第48-53页
     ·实验设计第48-50页
     ·基于整个页面的改进VSM算法与传统VSM算法的实验第50页
     ·基于HITS,Best-First和SAGA的主题搜索策略的实验对比第50-53页
   ·本章小结第53-54页
结论第54-55页
致谢第55-56页
参考文献第56-59页
攻读学位期间的研究成果第59页

论文共59页,点击 下载论文
上一篇:基于OpenGL的兰州石化炼油厂管线三维建模与可视化研究
下一篇:基于图像处理及支持向量机的车牌识别技术研究