首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于改进shark-search算法的主题爬虫的研究与实现

摘要第4-6页
ABSTRACT第6-7页
第一章 绪论第11-17页
    1.1 研究背景及意义第11-12页
    1.2 网络爬虫的研究现状第12-14页
    1.3 论文的主要工作第14-15页
    1.4 论文的结构安排第15-17页
第二章 面向主题网络爬虫的相关理论与技术第17-25页
    2.1 文本信息处理第17-19页
        2.1.1 特征选取第17-18页
        2.1.2 文本相近度计算第18-19页
    2.2 链接去重技术第19-20页
    2.3 同义词词林第20-22页
    2.4 页面分析第22-23页
    2.5 评价方法第23页
    2.6 本章小结第23-25页
第三章 基于改进shark-search算法的主题爬虫第25-33页
    3.1 Shark-Search算法分析第25-28页
        3.1.1 文本主题相关度计算简单第26-27页
        3.1.2 隧道问题第27-28页
    3.2 改进策略第28-32页
        3.2.1 针对Shark-Search算法的改进第28-31页
        3.2.2 基于层次统计的URL调度算法第31-32页
    3.3 本章小结第32-33页
第四章 系统实现与结果评价第33-46页
    4.1 系统设计第33-42页
        4.1.1 框架结构设计第33-36页
        4.1.2 关键子模块设计第36-41页
        4.1.3 系统运行流程第41-42页
    4.2 实验第42-43页
        4.2.1 基于同义词词林的主题词扩展算法实验第42-43页
        4.2.2 NSKD爬虫实验第43页
    4.3 结果评价第43-45页
    4.4 本章小结第45-46页
第五章 总结与展望第46-48页
    5.1 本文工作总结第46页
    5.2 未来工作展望第46-48页
参考文献第48-51页
致谢第51页

论文共51页,点击 下载论文
上一篇:《内经》合谷刺法的临床应用研究
下一篇:子宫动脉超声、PPG及血清学指标联合预测子痫前期的研究