首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

面向微博的数据采集和分析系统的设计与实现

摘要第1-5页
ABSTRACT第5-11页
第一章 绪论第11-15页
   ·研究背景和意义第11页
   ·研究内容第11-12页
   ·系统总体架构第12-14页
   ·组织结构第14-15页
第二章 国内外相关技术及研究现状第15-21页
   ·网络信息采集技术第15-16页
     ·基于整个万维网的信息抓取第15页
     ·基于主题的信息爬取第15页
     ·增量式信息爬取第15页
     ·分布式网络爬虫第15-16页
   ·网页节点的评价方法第16-19页
     ·PageRank算法第16-17页
     ·HITS算法第17-18页
     ·DistanceRank算法第18-19页
     ·无用链接的检测技术第19页
   ·针对微博的信息挖掘研究第19-20页
     ·微博短文本挖掘第19-20页
     ·情感倾向性分析第20页
     ·话题趋势检测第20页
   ·本章小结第20-21页
第三章 微博数据的分类爬取及存储第21-43页
   ·微博应用的创建第21-22页
   ·OAuth授权机制第22-26页
   ·爬虫的设计和调度第26-29页
   ·微博数据获取第29-39页
     ·用户信息获取第30-32页
     ·用户标签获取第32-33页
     ·用户关系获取第33-34页
     ·微博内容获取第34-38页
     ·微博评论获取第38-39页
   ·数据库设计第39-42页
   ·本章小结第42-43页
第四章 基于相对权威度和用户活力的微博用户权威度评价算法(UAEA)第43-65页
   ·评价算法综述第43-44页
   ·基于相对权威度的UA值分配第44-46页
     ·算法描述第44-46页
     ·算法效率第46页
   ·基于用户活力的UA值分配第46-49页
     ·算法描述第46-48页
     ·算法效率第48-49页
   ·UAEA评价算法第49页
   ·算法测试第49-63页
     ·基于相对权威度的评价算法测试第50-54页
     ·UAEA评价算法测试第54-63页
   ·UAEA算法的不足第63-64页
   ·本章小结第64-65页
第五章 微博热点内容发现第65-72页
   ·引言第65页
   ·热门微博的发现第65-68页
     ·单条评论的热度评价第65-66页
     ·单条微博的热度评价第66-68页
   ·热门词汇的提取第68-71页
     ·去停用词第68-70页
     ·分词第70页
     ·热门词汇的提取第70-71页
   ·本章小结第71-72页
第六章 总结与展望第72-74页
   ·主要工作及创新点第72-73页
   ·未来研究方向第73-74页
参考文献第74-78页
致谢第78-79页
作者攻读学位期间发表的学术论文目录第79页

论文共79页,点击 下载论文
上一篇:基于安全多方计算的网络测量数据共享模型研究
下一篇:支持跨平台的RELOAD协议栈设计与实现