基于Web信息抽取的网络舆情统计与分析
摘要 | 第6-8页 |
ABSTRACT | 第8-10页 |
第一章 绪论 | 第15-20页 |
1.1 研究背景 | 第15-18页 |
1.1.1 研究目的及意义 | 第15-16页 |
1.1.2 国内外研究现状 | 第16-18页 |
1.2 本文的主要研究内容 | 第18-20页 |
第二章 相关概念与技术描述 | 第20-30页 |
2.1 网络舆情概念及组成要素 | 第20-22页 |
2.1.1 网络舆情的概念 | 第20页 |
2.1.2 网络舆情的组成要素 | 第20-22页 |
2.2 文本聚类算法描述 | 第22-25页 |
2.2.1 支持向量机算法 | 第22-23页 |
2.2.2 K近邻算法 | 第23-24页 |
2.2.3 层次聚类算法 | 第24-25页 |
2.3 文本表示模型 | 第25-28页 |
2.3.1 文本表示方法 | 第25-27页 |
2.3.2 数据降维方法 | 第27-28页 |
2.4 小结 | 第28-30页 |
第三章 网络数据采集及舆情语料库构建 | 第30-44页 |
3.1 微博数据采集 | 第30-38页 |
3.1.1 微博用户情况 | 第30-31页 |
3.1.2 微博数据采集 | 第31页 |
3.1.3 网络爬虫-企业版新闻抓取系统 | 第31-38页 |
3.2 网络舆情语料库构建 | 第38-43页 |
3.2.1 舆情语料的人工分类 | 第38-41页 |
3.2.2 数据预处理 | 第41-42页 |
3.2.3 网络舆情语料的文本表示 | 第42-43页 |
3.3 小结 | 第43-44页 |
第四章 基于词项关联关系的FCM微博聚类算法 | 第44-54页 |
4.1 引言 | 第44-46页 |
4.2 词项关联关系 | 第46-48页 |
4.2.1 互信息向量 | 第46-47页 |
4.2.2 同一文档内关联关系 | 第47页 |
4.2.3 不同文档间关联关系 | 第47-48页 |
4.3 FCM聚类算法 | 第48-49页 |
4.4 基于词项关联关系的FCM聚类算法 | 第49-51页 |
4.5 实验结果与分析 | 第51-53页 |
4.5.1 数据来源 | 第51页 |
4.5.2 实验结果与分析 | 第51-53页 |
4.6 小结 | 第53-54页 |
第五章 网络舆情情感倾向性分析实例研究 | 第54-62页 |
5.1 我国房地产网络舆情现状 | 第54-56页 |
5.2 情感倾向分析-以合肥市房地产为例 | 第56-60页 |
5.2.1 网络舆情数据准备 | 第56-57页 |
5.2.2 基于SVM的网络舆情的情感分析方法 | 第57-58页 |
5.2.3 房地产舆情文本情感倾向性分类 | 第58-60页 |
5.3 合肥房地产网络舆情情感倾向分析 | 第60-61页 |
5.3.1 合肥房地产网络舆情分析 | 第60-61页 |
5.3.2 网络舆情预警建议 | 第61页 |
5.4 小结 | 第61-62页 |
第六章 结论与展望 | 第62-64页 |
致谢 | 第64-65页 |
参考文献 | 第65-71页 |
作者读研期间所取得的读研成果 | 第71页 |