首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于HITS算法的微博采集系统设计与实现

摘要第5-7页
Abstract第7-8页
第一章 绪论第9-13页
    1.1 研究背景及意义第9-10页
        1.1.1 微博发展背景第9页
        1.1.2 微博信息采集的意义第9-10页
    1.2 国内外研究现状第10-11页
    1.3 主要研究内容第11页
    1.4 论文组织结构第11-13页
第二章 相关理论和技术第13-22页
    2.1 网页信息采集技术第13-15页
        2.1.1 通用网络爬虫第13-14页
        2.1.2 主题爬虫第14页
        2.1.3 增量式爬虫第14页
        2.1.4 分布式爬虫第14-15页
    2.2 基于服务器API接口的信息采集第15-17页
        2.2.1 新浪微博API第15-16页
        2.2.2 OAuth2.0用户身份认证第16-17页
    2.3 Web信息抽取第17-18页
        2.3.1 DOM第17页
        2.3.2 Xpath第17-18页
    2.4 用户影响力评价第18-21页
        2.4.1 PageRank第18-20页
        2.4.2 K-shell算法第20-21页
        2.4.3 无用链接检测技术第21页
    2.5 本章小结第21-22页
第三章 基于HITS算法的微博用户影响力评价方法及改进第22-28页
    3.1 HITS算法的原理第22页
    3.2 HITS算法的不足第22-23页
    3.3 改进HITS算法的步骤第23-25页
    3.4 改进HITS算法的实验结果分析第25-27页
    3.5 本章小结第27-28页
第四章 系统需求分析与设计第28-44页
    4.1 系统目标第28-29页
    4.2 系统需求分析第29-31页
        4.2.1 系统功能性需求分析第29-30页
        4.2.2 系统非功能性能需求第30-31页
    4.3 系统总体设计第31-32页
    4.4 系统功能模块设计第32-39页
        4.4.1 获取授权模块设计第33-35页
        4.4.2 信息采集模块设计第35-38页
        4.4.3 数据处理模块设计第38-39页
    4.5 数据库设计第39-42页
        4.5.1 数据库的创建第40页
        4.5.2 概念模型第40-41页
        4.5.3 数据库表的设计第41-42页
    4.6 本章小结第42-44页
第五章 系统实现与测试第44-51页
    5.1 系统开发环境第44-45页
    5.2 信息采集模块第45-47页
    5.3 数据排序模块第47-48页
    5.4 系统测试第48-50页
    5.5 本章小结第50-51页
第六章 总结与展望第51-52页
    6.1 总结第51页
    6.2 展望第51-52页
参考文献第52-54页
致谢第54页

论文共54页,点击 下载论文
上一篇:基于Web GIS的果园作业管理系统设计与实现
下一篇:基于网络数据包分析的入侵检测系统的设计