基于校园网流量的舆情热词提取及分类研究

摘要	第5-6页
Abstract	第6-7页
第1章绪论	第12-17页
1.1 研究背景及意义	第12-14页
1.2 国内外研究现状	第14-15页
1.3 论文的组织结构	第15-17页
第2章校园网流量采集系统的构建和部署	第17-24页
2.1 网络流量采集工具选型	第18-19页
2.2 流量采集系统结构	第19-20页
2.3 基于流量的动态协议检测	第20-22页
2.4 校园网流量采集系统的部署	第22-23页
2.5 本章小结	第23-24页
第3章基于网络流量的校园区域舆情数据源重构	第24-31页
3.1 网络爬虫研究	第24-25页
3.2 基于Scrapy框架的网页爬取	第25-28页
3.2.1 Scrapy基本原理	第25-28页
3.3 校园区域舆情数据源的重构	第28-30页
3.4 本章小结	第30-31页
第4章校园区域舆情热词提取及分类	第31-43页
4.1 网页正文抽取	第31-36页
4.1.1 基于行块分布算法的网页正文抽取	第31-32页
4.1.2 对行块分布算法的改进	第32-36页
4.2 结巴分词	第36-39页
4.2.1 未登录词的处理	第37-38页
4.2.2 TF-IDF关键词提取	第38-39页
4.3 分类	第39-40页
4.3.1 LIBLINEAR和LIBSVM比较	第39页
4.3.2 线性LIBLINEAR介绍	第39-40页
4.4 网络舆情热词分类模型	第40-42页
4.4.1 TextGrocery简介	第40-41页
4.4.2 模型训练	第41-42页
4.5 本章小结	第42-43页
第5章校园网流量及舆情分析系统实现	第43-52页
5.1 系统开发环境	第43页
5.2 系统总体架构	第43-44页
5.3 分析模块	第44-45页
5.4 展示模块	第45-51页
5.4.1 流量统计模块	第46-47页
5.4.2 流量分析模块	第47-48页
5.4.3 舆情热词提取及分类	第48-50页
5.4.4 用户分析模块	第50页
5.4.5 系统管理模块	第50-51页
5.5 系统存储结构	第51页
5.6 本章小结	第51-52页
总结与展望	第52-53页
参考文献	第53-56页
攻读硕士学位期间所参加的科研项目	第56-57页
攻读硕士学位期间发表的论文	第57-58页
致谢	第58页