基于微博的网络舆情分析系统的设计与实现

摘要	第5-6页
abstract	第6-7页
第一章绪论	第14-19页
1.1 研究工作的背景与意义	第14-15页
1.2 国内外研究现状	第15-16页
1.3 本文的主要研究内容	第16-17页
1.4 本论文的组织结构	第17-19页
第二章总体设计及相关理论研究	第19-34页
2.1 系统总体设计	第19-23页
2.1.1 网络舆情分析系统概述	第19-21页
2.1.2 网络舆情分析系统的框架组成	第21-22页
2.1.3 本系统总体设计	第22-23页
2.2 微博信息采集技术	第23-25页
2.2.1 基于微博开放平台的数据获取技术	第23页
2.2.2 基于网络爬虫的微博数据获取技术	第23-25页
2.3 文本预处理技术	第25-27页
2.3.1 网页正文信息提取	第25-26页
2.3.2 网页正文预处理	第26-27页
2.4 文本表示模型	第27-31页
2.4.1 空间向量模型（VSM）	第27-29页
2.4.2 主题模型（LDA）	第29-31页
2.4.3 分布式表达的词向量模型（word2vec）	第31页
2.5 文本聚类算法	第31-33页
2.5.1 聚类算法简介	第31-32页
2.5.2 聚类算法的分类	第32-33页
2.6 本章小结	第33-34页
第三章基于Improved-word2vec&TF-IDF的文本表示模型	第34-54页
3.1 背景知识	第34-39页
3.1.1 词向量	第34-35页
3.1.2 统计语言模型	第35-36页
3.1.3 n-gram模型	第36-37页
3.1.4 神经概率语言模型	第37-39页
3.2 word2vec原理剖析	第39-46页
3.2.1 word2vec的模型	第39-40页
3.2.2 CBOW模型	第40-44页
3.2.3 Skip-gram模型	第44-46页
3.3 基于word2vec的改进文本表示模型	第46-49页
3.3.1 传统文本表示模型的问题	第46-47页
3.3.2 基于Improved-word2vec&TF-IDF的文本表示模型	第47-49页
3.4 实验与分析	第49-53页
3.4.1 实验数据与预处理	第49-52页
3.4.2 实验评价指标与结果分析	第52-53页
3.5 本章小结	第53-54页
第四章基于Improved-SP&HAC算法的微博话题检测	第54-68页
4.1 算法概述	第54-57页
4.1.1 微博话题检测的流程	第54-55页
4.1.2 聚类算法的选取	第55-57页
4.2 一种改进的Single-pass算法	第57-60页
4.3 微博话题检测	第60-63页
4.3.1 话题检测的算法流程	第60-61页
4.3.2 基于HAC算法的话题合并	第61-63页
4.4 实验与分析	第63-66页
4.4.1 实验一：算法性能比较	第63-66页
4.4.2 实验二：不同阈值对算法性能的影响	第66页
4.5 本章小结	第66-68页
第五章基于微博的网络舆情分析系统的实现与测试	第68-81页
5.1 数据库设计	第68-71页
5.2 功能模块设计	第71-75页
5.2.1 微博数据采集模块	第71-72页
5.2.2 文本预处理模块	第72-73页
5.2.3 话题检测模块	第73-75页
5.2.4 应用管理模块	第75页
5.3 系统模块实现	第75-79页
5.3.1 系统开发环境	第75-76页
5.3.2 登录模块	第76-77页
5.3.3 系统主界面	第77页
5.3.4 系统其他主要页面	第77-79页
5.4 系统测试	第79-80页
5.4.1 测试内容	第79页
5.4.2 测试结果	第79-80页
5.5 本章小结	第80-81页
第六章总结与展望	第81-83页
6.1 本文总结	第81-82页
6.2 未来展望	第82-83页
致谢	第83-84页
参考文献	第84-89页
攻读硕士学位期间取得的成果	第89-90页