首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

海量web舆情挖掘算法研究

摘要第1-5页
ABSTRACT第5-8页
第一章 引言第8-13页
   ·课题背景与研究意义第8-9页
   ·国内外web 舆情挖掘现状第9-11页
   ·主要工作和成果第11-12页
   ·论文组织结构第12-13页
第二章 相关理论及关键技术第13-28页
   ·海量web 舆情挖掘概要第13-14页
     ·web 舆情概念及特征第13页
     ·web 舆情挖掘步骤第13-14页
   ·海量web 舆情挖掘关键技术第14-27页
     ·爬虫技术第14-19页
     ·网页解析技术第19-21页
     ·分类技术第21-23页
     ·聚类技术第23-24页
     ·海量数据处理技术第24-27页
   ·本章小结第27-28页
第三章 可更改策略的爬虫子系统第28-41页
   ·系统概述第28-30页
     ·整体架构第28-29页
     ·逻辑结构第29-30页
   ·可更改策略的爬虫子系统关键技术第30-36页
     ·URL 过滤第30-31页
     ·URL 判重第31-33页
     ·策略的更改第33-36页
   ·可更改策略的爬虫子系统模块设计第36-40页
     ·用户界面模块第36-37页
     ·主控机/爬虫机模块第37-39页
     ·处理器模块第39-40页
   ·本章小结第40-41页
第四章 基于内容特征的 web 舆情发现第41-61页
   ·基于内容特征的web 舆情发现流程第41-42页
   ·基于两层结构的分类算法第42-50页
     ·特征选择与权重计算第43-44页
     ·web 信息分类模型建立第44-45页
     ·算法描述第45-48页
     ·算法特性分析第48-49页
     ·试验第49-50页
   ·基于数据划分的分裂式层次聚类算法实现第50-60页
     ·基于最大频繁词集的数据划分第51-53页
     ·分裂式层次聚类算法第53-55页
     ·关键模块设计第55-57页
     ·基于最大频繁词集的数据划分方法在HADOOP 平台上的实现第57-60页
   ·本章小结第60-61页
第五章 系统设计与实现第61-72页
   ·系统设计第61-64页
     ·系统架构设计第61-63页
     ·数据库设计第63-64页
   ·系统工作流程第64-67页
     ·可更改策略的爬虫子系统工作流程第64-65页
     ·基于内容特征的web 舆情发现工作流程第65-67页
   ·实验结果展示第67-68页
     ·可更改策略的爬虫子系统实验结果第67页
     ·基于内容特征的web 舆情发现实验结果第67-68页
   ·系统演示第68-71页
     ·可更改策略的爬虫子系统控制界面第68-69页
     ·web 信息分类模型第69-70页
     ·web 舆情发现展示第70-71页
   ·本章小结第71-72页
第六章 总结与展望第72-74页
   ·总结第72-73页
   ·展望第73-74页
致谢第74-75页
参考文献第75-77页
攻读硕士期间研究成果第77-78页

论文共78页,点击 下载论文
上一篇:网络流量行为分析应用研究
下一篇:科技论文社区的研究及其应用