摘要 | 第3-5页 |
abstract | 第5-6页 |
第一章 绪论 | 第9-14页 |
第一节 研究背景以及研究意义 | 第9-10页 |
第二节 文献综述 | 第10-12页 |
一、以情感词典为核心的情感分类研究 | 第10页 |
二、以特征选择和特征提取为核心的机器学习的情感分类研究 | 第10-12页 |
第三节 研究思路与创新 | 第12页 |
一、研究思路 | 第12页 |
二、本文创新点 | 第12页 |
第四节 论文安排 | 第12-14页 |
第二章 文本情感分类的相关技术 | 第14-30页 |
第一节 情感分析概述 | 第14页 |
第二节 文本预处理 | 第14-17页 |
一、基于字典、词库匹配的方法 | 第14-15页 |
二、基于词的频度统计的分词方法 | 第15-16页 |
三、基于知识理解的方法 | 第16页 |
四、常用中文分词包 | 第16-17页 |
第三节 情感词典 | 第17-19页 |
一、知网(Hownet)情感词典 | 第17-18页 |
二、中文情感词汇本体库 | 第18-19页 |
三、台湾大学NTUSD | 第19页 |
四、哈工大信息检索研究中心同义词词林扩展版 | 第19页 |
第四节 特征降维 | 第19-24页 |
一、特征提取 | 第19-21页 |
二、特征选择 | 第21-24页 |
第五节 分类器设计 | 第24-28页 |
一、分类器设计准则 | 第24页 |
二、常见的几种分类器 | 第24-28页 |
第六节 文本分类性能测评常用方法 | 第28-30页 |
一、正确率、召回率和F-测度值 | 第28-29页 |
二、微平均和宏平均 | 第29-30页 |
第三章 基于情感词典的微博评论情感分类 | 第30-43页 |
第一节 微博评论预处理 | 第30-34页 |
一、数据清洗 | 第30-31页 |
二、对评论文本进行分词 | 第31-32页 |
三、文本的词性标注 | 第32-34页 |
第二节 微博情感词典的构建 | 第34-37页 |
一、基础情感词典 | 第34-35页 |
二、程度副词词典 | 第35-36页 |
三、否定词词典 | 第36-37页 |
第三节 计算评论情感得分 | 第37-41页 |
第四节 分类效果评价 | 第41-43页 |
第四章 基于机器学习的微博情感分类 | 第43-48页 |
第一节 以微博评论的情感词为特征,采用机器学习的方法对微博评论进行分类 | 第43-46页 |
一、建立特征矩阵 | 第43-44页 |
二、特征选择 | 第44-45页 |
三、性能评价 | 第45-46页 |
第二节 加入博主发文得分特征,采用机器学习的方法对微博评论进行分类 | 第46-48页 |
第五章 总结和展望 | 第48-50页 |
第一节 论文总结 | 第48页 |
第二节 展望 | 第48-50页 |
参考文献 | 第50-54页 |
致谢 | 第54-55页 |
攻读学位期间发表的学术论文和研究成果 | 第55-56页 |