首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于本体的主题爬虫的设计与实现

摘要第1-6页
Abstract第6-7页
致谢第7-11页
第一章 绪论第11-20页
   ·研究背景第11-12页
   ·搜索引擎发展现状及趋势第12-19页
     ·搜索引擎概述第12-14页
     ·搜索引擎的分类及工作原理第14-16页
     ·主题搜索引擎与通用搜索引擎的区别第16-19页
   ·论文研究内容及结构第19-20页
第二章 相关理论及研究现状第20-30页
   ·本体相关理论第20-25页
     ·本体的概念第20-21页
     ·领域本体的构造第21-25页
     ·本体在信息检索领域的应用第25页
   ·主题爬虫的相关理论及技术第25-30页
     ·网络爬虫的模型第25-27页
     ·网络爬虫的搜索策略第27-28页
     ·主题爬虫搜索算法第28-30页
第三章 基于本体的最好优先爬行算法的设计与实现第30-48页
   ·最好优先爬行算法分析第30-35页
     ·基础假设第30页
     ·启发式策略第30-33页
     ·最好优先爬行算法第33-35页
   ·基于本体的最好优先改进算法第35-48页
     ·最好优先爬行算法中的隧道问题第36-37页
     ·文本主题判定第37-40页
     ·基于本体的主题相似性判断第40-42页
     ·基于本体的不同主题相关度的判断第42-44页
     ·改进的最好优先算法的实现第44-48页
第四章 主题爬虫的设计实现第48-60页
   ·主题爬虫的体系结构第48页
   ·网页采集模块第48-50页
   ·网页分析模块第50-54页
     ·HTML标签第50-52页
     ·网页类型判断第52页
     ·HTML文档预处理第52-54页
   ·URL过滤模块第54-56页
     ·URL链接的提取第54-55页
     ·规整URL链接第55-56页
   ·已经访问URL的判定模块第56-57页
   ·实验结果第57-60页
     ·评价指标第57-58页
     ·系统开发运行环境第58页
     ·试验及结果评价第58-60页
第五章 总结与展望第60-61页
   ·本文总结第60页
   ·研究展望第60-61页
参考文献第61-65页
攻读硕士学位期间发表的论文第65页

论文共65页,点击 下载论文
上一篇:有理Bézier曲线的等距曲线有理逼近
下一篇:基于主动探测的可用带宽测量方法在无线环境中的应用测试分析