首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

安卓技术信息的主题爬虫技术研究与实现

摘要第5-6页
Abstract第6页
中英文对照表第9-10页
第一章 绪论第10-14页
    1.1 研究背景及意义第10页
    1.2 网络爬虫研究现状综述第10-12页
        1.2.1 常见爬虫研究方向第10-11页
        1.2.2 国内外著名的主题爬虫第11-12页
    1.3 研究内容第12-13页
    1.4 论文组织结构第13-14页
第二章 相关技术第14-27页
    2.1 主题爬行策略技术第14-18页
        2.1.1 超文本归纳主题搜索第14-15页
        2.1.2 网页排名与山顶算法第15-16页
        2.1.3 最佳优先搜索第16页
        2.1.4 鱼群搜索与鲨鱼搜索第16-18页
    2.2 主题相关度判别技术第18-23页
        2.2.1 主题相关度计算方法第19-21页
        2.2.2 正文提取方法第21-22页
        2.2.3 权重赋值方法第22-23页
    2.3 隧道穿越技术第23-24页
    2.4 主题爬虫系统工作流程第24-25页
    2.5 网络中垂直领域信息资源现状第25-27页
第三章 主题爬行策略第27-39页
    3.1 功能分析第27-28页
        3.1.1 主题爬行策略概述第27页
        3.1.2 设计与实现要求第27-28页
    3.2 设计方案第28页
    3.3 功能设计第28-33页
        3.3.1 选取爬行策略类型第28-29页
        3.3.2 优化鲨鱼搜索第29-31页
        3.3.3 网页排序算法融入策略第31-32页
        3.3.4 使用兄弟节点作参考第32-33页
    3.4 方案实现第33-39页
第四章 网页主题相关度判断第39-48页
    4.1 功能分析第39-40页
        4.1.1 网页主题相关度判断概述第39页
        4.1.2 设计与实现要求第39-40页
    4.2 设计方案第40页
    4.3 功能设计第40-46页
        4.3.1 建立主题词库第40-42页
        4.3.2 对正文提取及代码段去噪第42-43页
        4.3.3 安卓技术信息资源分类处理第43-45页
        4.3.4 对单块文本主题相似度计算第45-46页
    4.4 方案实现第46-48页
第五章 隧道穿越第48-56页
    5.1 功能分析第48-49页
        5.1.1 隧道穿越概述第48页
        5.1.2 设计与实现要求第48-49页
    5.2 设计方案第49页
    5.3 功能设计第49-51页
        5.3.1 关联特性和深度限制第49页
        5.3.2 判断主题孤岛现象发生第49-50页
        5.3.3 递减收集方法第50-51页
    5.4 方案实现第51-56页
第六章 总结与展望第56-58页
    6.1 总结第56页
    6.2 下一步工作及展望第56-58页
致谢第58-59页
参考文献第59-61页

论文共61页,点击 下载论文
上一篇:人大代表影响公共政策制定问题研究--以内蒙古乌兰浩特市为例
下一篇:中国基层公务员职业倦怠问题研究