论文创新点 | 第1-7页 |
摘要 | 第7-9页 |
Abstract | 第9-16页 |
1 绪论 | 第16-22页 |
·引言 | 第16页 |
·研究背景及意义 | 第16-17页 |
·应用领域 | 第17-19页 |
·公共领域 | 第17-18页 |
·舆情监控 | 第17页 |
·事件预测 | 第17-18页 |
·商业领域 | 第18-19页 |
·商品推荐 | 第18页 |
·企业调查 | 第18-19页 |
·跨学科领域 | 第19页 |
·更高级系统的底层结构 | 第19页 |
·本文创新点 | 第19-21页 |
·本文的组织结构 | 第21-22页 |
2 国内外研究进展及理论基础 | 第22-38页 |
·情感分析研究概述 | 第22-25页 |
·情感信息分类 | 第22-24页 |
·主客观信息分类 | 第22页 |
·情感极性信息 | 第22-23页 |
·多类别情感信息 | 第23-24页 |
·情感分析研究层次 | 第24-25页 |
·词语级 | 第24页 |
·短语级 | 第24页 |
·句子级 | 第24-25页 |
·篇章级 | 第25页 |
·微博短文本研究概述 | 第25-28页 |
·微博短文本的概念和特征 | 第25-26页 |
·短文本的概念 | 第25页 |
·微博的特性 | 第25-26页 |
·微博的相关研究 | 第26-27页 |
·利用微博内部特征 | 第26页 |
·利用外部知识体系 | 第26-27页 |
·利用微博相互关系 | 第27页 |
·微博短文本的研究资源 | 第27-28页 |
·微博短文本情感分析研究的理论基础 | 第28-37页 |
·倾向性分类的评估标准 | 第28页 |
·特征选择方法 | 第28-29页 |
·机器学习方法 | 第29-37页 |
·支持向量机分类器的基本原理 | 第29-32页 |
·贝叶斯分类器的基本原理 | 第32-34页 |
·K近邻分类器的基本原理 | 第34-37页 |
·小结 | 第37-38页 |
3 基于特征词与词性组合的主客观分类方法 | 第38-56页 |
·引言 | 第38-39页 |
·微博短文本的主观特征 | 第39-43页 |
·预处理 | 第39-40页 |
·情感词典 | 第40-41页 |
·情感特征 | 第41-43页 |
·多元词汇特征(N-GRAM features) | 第41-42页 |
·多元词性特征(N-POS features) | 第42页 |
·微博上下文特征 | 第42-43页 |
·微博短文本主客观判别方法 | 第43-44页 |
·基于词典的主客观判别方法 | 第43页 |
·基于统计的主客观判别方法 | 第43-44页 |
·基于Vote-AdaBoost的组合分类方法 | 第44-51页 |
·基于加权投票的组合分类模型 | 第45-46页 |
·加权投票 | 第45页 |
·权重的训练 | 第45-46页 |
·分类器及特征的选择 | 第46页 |
·AdaBoost方法 | 第46-48页 |
·集成学习方法 | 第46-47页 |
·AdaBoost算法流程 | 第47-48页 |
·AdaBoost的有效性分析 | 第48页 |
·Vote-AdaBoost组合分类流程 | 第48-51页 |
·流程设计 | 第48-49页 |
·优化策略 | 第49-50页 |
·计算流程 | 第50-51页 |
·实验与分析 | 第51-54页 |
·实验1 特征之间的比较 | 第51-53页 |
·实验2 AdaBoost集成学习效果的比较 | 第53-54页 |
·实验3 权重投票和Vote-AdaBoost方法的对比 | 第54页 |
·小结 | 第54-56页 |
4 基于情感要素的情感极性分析方法 | 第56-82页 |
·引言 | 第56-57页 |
·情感要素 | 第57-69页 |
·情感要素的定义 | 第57-58页 |
·情感要素的范围 | 第58-62页 |
·多元词汇特征 | 第58页 |
·特定语法规则的组合特征 | 第58-60页 |
·基于句法分析的主谓特征 | 第60-62页 |
·微博特有的表情符号 | 第62页 |
·情感特征判断依据 | 第62-68页 |
·情感词典 | 第62-63页 |
·语义关系词典 | 第63-64页 |
·基于统计的特征抽取 | 第64-65页 |
·否定词和程度副词 | 第65-68页 |
·特征情感值的计算方法 | 第68-69页 |
·基于最短路径关键点的知网基准词获取方法 | 第69-74页 |
·知网基本介绍 | 第69-70页 |
·知网相似度计算方法 | 第70-72页 |
·虚词概念相似度 | 第70页 |
·实词概念相似度 | 第70-72页 |
·备选基准词相似度关系图 | 第72页 |
·基于最短距离词汇链的基准词抽取方法 | 第72-73页 |
·知网情感相似度计算 | 第73-74页 |
·利用HowNet语义相似度计算单词的语义倾向值 | 第74页 |
·利用HowNet语义相关场计算单词的语义倾向值 | 第74页 |
·利用改进方法计算单词的语义倾向值 | 第74页 |
·基于情感要素的情感极性判别方法 | 第74-77页 |
·词频统计方法 | 第75-76页 |
·基于机器学习的方法 | 第76-77页 |
·情感词典特征 | 第76页 |
·情感要素特征 | 第76-77页 |
·多步分类的判别方法 | 第77页 |
·实验和分析 | 第77-81页 |
·实验设计 | 第77-78页 |
·实验1 知网基准词获取方法的对比 | 第78-79页 |
·实验2 不同情感极性判别方法的对比 | 第79-81页 |
·小结 | 第81-82页 |
5 多类情感判别的细粒度分析方法研究 | 第82-97页 |
·引言 | 第82-83页 |
·细粒度特征抽取方法 | 第83-85页 |
·面向多类别的TF-IDF权重计算方法 | 第83-84页 |
·情感倾向判断 | 第84-85页 |
·归一化处理 | 第85页 |
·抽取流程 | 第85-87页 |
·情感本体库 | 第86页 |
·情感特征库 | 第86-87页 |
·表情符号 | 第86-87页 |
·情感特征词 | 第87页 |
·强调标点 | 第87页 |
·处理流程 | 第87-91页 |
·权重计算 | 第87-88页 |
·情感判断 | 第88-91页 |
·实验与分析 | 第91-95页 |
·实验设计 | 第91页 |
·实验数据 | 第91页 |
·实验方法 | 第91-92页 |
·TF方法 | 第91页 |
·CHIMAX方法 | 第91-92页 |
·TFIDF方法 | 第92页 |
·D(TF)方法 | 第92页 |
·D(TFIDF)方法 | 第92页 |
·结果与分析 | 第92-94页 |
·实验1 | 第92-93页 |
·实验2 | 第93-94页 |
·参与评测结果 | 第94-95页 |
·小结 | 第95-97页 |
6 研究结论及下一步工作 | 第97-99页 |
·研究结论 | 第97页 |
·下一步研究方向 | 第97-99页 |
参考文献 | 第99-108页 |
攻博期间发表的主要学术论文 | 第108-109页 |
参与主要科研项目 | 第109页 |
参加评测任务 | 第109-110页 |
致谢 | 第110-111页 |