首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

面向特定主题及其传播人群的网络爬行器设计

摘要第4-5页
Abstract第5页
第1章 绪论第8-13页
    1.1 研究背景第8-9页
    1.2 研究现状第9-11页
    1.3 本文的研究内容与组织结构第11-13页
        1.3.1 本文的研究内容第11-12页
        1.3.2 本文的组织结构第12-13页
第2章 网络爬行器概述第13-34页
    2.1 搜索引擎相关技术概述第13-15页
        2.1.1 搜索引擎历史第13-14页
        2.1.2 搜索引擎组成及分类第14页
        2.1.3 搜索引擎的工作原理第14-15页
    2.2 通用网络爬行器概述第15-20页
        2.2.1 网络爬行器体系结构第16-19页
        2.2.2 通用网络爬行器的爬行策略第19-20页
    2.3 特定主题网络爬行器关键技术第20-28页
        2.3.1 基于 Web 的特定主题网络爬行器技术及分析第22-27页
        2.3.2 特定主题的描述与分词的定义第27-28页
    2.4 HTML 文档结构分析第28-31页
        2.4.1 HTML 文档格式及特点第28-29页
        2.4.2 HTML 文档的 Tag 树第29-30页
        2.4.3 HTML 文档结构分析第30-31页
    2.5 微博数据获取相关技术分析及研究第31-34页
        2.5.1 微博数据获取方式第31-32页
        2.5.2 微博数据虑重方法第32-33页
        2.5.3 微博数据分析第33-34页
第3章 特定主题网络爬行器的设计第34-48页
    3.1 系统平台和系统运行环境第34页
    3.2 网络信息挖掘系统介绍第34-38页
        3.2.1 系统设计原则第36-37页
        3.2.2 系统架构介绍第37-38页
    3.3 系统主要模块介绍第38-45页
        3.3.1 确立主题和主题站点管理模块第38-42页
        3.3.2 数据采集模块第42-43页
        3.3.3 URL 管理模块第43-45页
    3.4 数据处理模块第45-46页
    3.5 数据库与基础运行库第46页
    3.6 本章小结第46-48页
第4章 微博主题人物节点爬行器的设计第48-52页
    4.1 微博爬行器关键技术第48-49页
    4.2 微博主题人物节点爬行器设计第49-50页
    4.3 微博主题人物爬行器模块框架第50-51页
    4.4 微博数据分析第51-52页
第5章 结论与展望第52-53页
参考文献第53-56页
作者简介及在学期间所取得的科研成果第56-57页
致谢第57页

论文共57页,点击 下载论文
上一篇:关于旅顺口区流动人口犯罪特征及应对的调查报告
下一篇:中低空遥感图像序列快速拼接方法研究