面向学生社交平台的情感倾向分析技术的研究
摘要 | 第4-5页 |
Abstract | 第5页 |
1 绪论 | 第8-14页 |
1.1 研究背景和意义 | 第8-10页 |
1.2 课题研究现状 | 第10-11页 |
1.3 本文主要内容 | 第11-12页 |
1.4 本文组织结构 | 第12-14页 |
2 基于学生极性的情感词典构建 | 第14-20页 |
2.1 语料库的收集 | 第14-15页 |
2.2 表情符号词典 | 第15-16页 |
2.3 学生极性词典扩建 | 第16-17页 |
2.4 词汇倾向加权方法 | 第17-18页 |
2.5 基于学生情感词典的词汇倾向加权 | 第18-20页 |
3 学生社交平台舆情信息采集与预处理 | 第20-34页 |
3.1 网络爬虫研究分析 | 第20-22页 |
3.1.1 网络爬虫原理 | 第20-21页 |
3.1.2 网络爬行策略 | 第21-22页 |
3.1.3 网络爬虫框架 | 第22页 |
3.2 社交平台舆情采集的策略选取 | 第22-26页 |
3.2.1 新浪微博数据采集策略选取分析 | 第23-24页 |
3.2.2 百度贴吧数据采集策略选取分析 | 第24-25页 |
3.2.3 人人网数据采集策略选取分析 | 第25-26页 |
3.3 舆情数据预处理 | 第26-29页 |
3.3.1 网络噪声的去除 | 第26-29页 |
3.3.2 数据库信息存储 | 第29页 |
3.4 自动好友搜索功能 | 第29-34页 |
3.4.1 百度贴吧分析 | 第30-31页 |
3.4.2 人人网分析 | 第31页 |
3.4.3 新浪微博分析 | 第31-32页 |
3.4.4 好友搜索算法 | 第32-34页 |
4 基于学生极性的文本倾向性分析方法 | 第34-42页 |
4.1 情感倾向分析概述 | 第34-35页 |
4.2 中文分词 | 第35-39页 |
4.2.1 常用分词系统 | 第36页 |
4.2.2 基于学生极性词典分词 | 第36-39页 |
4.3 情感倾向性计算方法 | 第39-42页 |
5 学生舆情监控系统设计 | 第42-55页 |
5.1 系统整体设计 | 第42-46页 |
5.1.0 需求分析 | 第42页 |
5.1.1 功能设计 | 第42-45页 |
5.1.2 系统架构设计 | 第45-46页 |
5.2 模块设计与实现 | 第46-52页 |
5.2.1 采集模块设计与实现 | 第46-50页 |
5.2.2 分析模块设计与实现 | 第50-52页 |
5.3 界面展示 | 第52-54页 |
5.4 本章小结 | 第54-55页 |
参考文献 | 第55-57页 |
致谢 | 第57-58页 |