首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--软件工程论文

基于海量舆情信息的话题检测系统的设计与实现

摘要第1-5页
ABSTRACT第5-9页
第1章 概述第9-14页
   ·背景第9页
   ·研究发展概况第9-11页
     ·话题检测发展现状第9-10页
     ·数据挖掘发展现状第10-11页
   ·论文的主要工作与贡献第11-12页
   ·论文结构第12-14页
第2章 关键技术介绍第14-24页
   ·聚类第14-16页
     ·聚类步骤第15页
     ·聚类算法第15-16页
   ·中文分词第16-18页
   ·LDA 模型第18-19页
     ·符号表示第18页
     ·LDA 简介第18-19页
     ·LDA 生成文本过程第19页
   ·Gibbs 抽样第19-20页
     ·简述第19-20页
     ·算法步骤第20页
   ·K 均值聚类第20-21页
   ·分布式技术第21-24页
     ·分布式文件系统第22-23页
     ·Map/Reduce 原理第23-24页
第3章 系统需求分析第24-37页
   ·系统概述第24页
   ·系统条件与限制第24-25页
   ·系统功能需求第25-26页
     ·功能划分第25页
     ·功能描述第25-26页
   ·系统性能需求第26-27页
   ·系统数据流分析第27-30页
   ·系统输入输出要求第30-33页
   ·系统运行环境第33-34页
   ·系统出错处理第34-36页
   ·本章小结第36-37页
第4章 系统概要设计第37-45页
   ·系统总体概要设计第37-38页
   ·数据获取模块概要设计第38页
   ·分词模块概要设计第38-39页
   ·话题检测模块概要设计第39-42页
     ·数据格式转化第39-40页
     ·采用 TF IDF 统计文本第40页
     ·采用 Gibbs 抽样分配主题第40-41页
     ·计算文本与主题的数量矩阵第41-42页
     ·计算词汇与主题的数量矩阵第42页
     ·输出结果第42页
   ·文本聚类模块概要设计第42-43页
   ·浏览模块概要设计第43-44页
   ·本章小结第44-45页
第5章 系统模块设计第45-62页
   ·简述第45页
   ·数据获取模块设计第45-49页
   ·数据分词模块设计第49-52页
   ·话题检测模块设计第52-56页
   ·文本聚类模块设计第56-61页
   ·本章小结第61-62页
第6章 系统部署与应用第62-74页
   ·系统开发环境第62-63页
   ·系统测试第63-73页
     ·系统模块测试第63-70页
     ·单机测试和分布式系统测试第70-73页
   ·本章小结第73-74页
第7章 总结与展望第74-76页
   ·总结第74-75页
   ·展望第75-76页
参考文献第76-79页
致谢第79页

论文共79页,点击 下载论文
上一篇:面向质量溯源的农产品电子商务服务平台设计与实现
下一篇:集团酒店综合管理平台交流中心系统的设计与实现