基于海量网络舆情信息的热点发现

摘要	第1-5页
ABSTRACT	第5-8页
第一章绪论	第8-14页
·课题背景及意义	第8-10页
·国内外现状分析	第10-12页
·课题来源	第12-13页
·论文内容安排	第13-14页
第二章相关理论研究	第14-26页
·文本分词	第14-16页
·分词规范	第14-15页
·歧义词与新词识别	第15-16页
·文本的表示模型	第16-18页
·文本的特征提取	第18-19页
·文本聚类方法	第19-24页
·划分方法（Partitioning Method）	第20-21页
·层次方法（Hierarchical Method）	第21-23页
·基于密度的方法（Density-Based Clustering Method）	第23-24页
·基于网格的聚类方法（Grid-Based Clustering Method）	第24页
·本章小结	第24-26页
第三章舆情信息热点发现的总体设计	第26-49页
·系统概述	第26页
·系统需求分析	第26-32页
·网页信息采集需求	第26-28页
·信息处理需求	第28页
·舆情热点需求	第28-29页
·舆情监控需求	第29-32页
·系统结构设计	第32-45页
·网页信息采集模块	第32-40页
·改进分布式爬虫	第33-37页
·信息抽取	第37-39页
·网页去重	第39-40页
·网页信息预处理模块	第40-45页
·舆情分析模块	第45页
·系统流程	第45-47页
·开发环境介绍	第47页
·本章小结	第47-49页
第四章关键技术研究与实现	第49-58页
·DAK 算法形成的背景	第49-50页
·DAK 算法实现过程	第50-53页
·热点生成	第53-56页
·文本自动摘要研究	第53-55页
·热点提取	第55-56页
·热点展示	第56页
·本章小结	第56-58页
第五章系统性能分析	第58-64页
·性能测试环境及测试过程	第58-59页
·测试结果分析	第59-63页
·本章小结	第63-64页
第六章总结与展望	第64-66页
·总结	第64页
·展望	第64-66页
致谢	第66-67页
参考文献	第67-70页
硕士期间发表的论文和参与的项目	第70-71页