中文摘要 | 第1-6页 |
Abstract | 第6-12页 |
第1章 绪论 | 第12-31页 |
·背景与意义 | 第12-14页 |
·文本情感分析发展概况 | 第14-27页 |
·基于词典的情感分析 | 第14-20页 |
·基于语料库的情感分析 | 第20-23页 |
·情感分析常用机器学习算法 | 第23-27页 |
·人物评价文本情感分析 | 第27页 |
·本文的研究内容与组织结构 | 第27-31页 |
·研究内容 | 第28-29页 |
·组织结构 | 第29-31页 |
第2章 人物评价文本语料库建设 | 第31-46页 |
·引言 | 第31-32页 |
·相关研究 | 第32-34页 |
·专用语料库建设 | 第32-33页 |
·多分类器融合 | 第33页 |
·主动学习 | 第33-34页 |
·人物评价语料采集 | 第34-36页 |
·人物评价语料的选取 | 第35页 |
·语料预处理 | 第35页 |
·人物评价语料的特征 | 第35-36页 |
·基于保守投票规则的多分类器融合的语料标注方法 | 第36-37页 |
·一个基于主动学习的专用语料库生成方法 | 第37-42页 |
·脏话处理的意义 | 第38-39页 |
·脏话的定义 | 第39页 |
·高精度分类器 | 第39-41页 |
·特殊数据过滤 | 第41页 |
·特征筛选 | 第41-42页 |
·实验以及结果分析 | 第42-45页 |
·小结 | 第45-46页 |
第3章 基于知识库和搜索引擎的人物分类 | 第46-75页 |
·相关研究 | 第46-48页 |
·两层架构的人物分类方法 | 第48-49页 |
·人物分类语料 | 第49-54页 |
·百度百科语料 | 第49-50页 |
·新闻语料 | 第50-54页 |
·基于知识库的人物分类 | 第54-62页 |
·采用词组作为特征 | 第54-61页 |
·采用词组加词性作为特征 | 第61-62页 |
·采用平均值筛选特征分类 | 第62页 |
·实验结果分析 | 第62页 |
·基于新闻的人物分类 | 第62-70页 |
·主题模型与LDA模型 | 第63-64页 |
·有效新闻以及“噪声新闻” | 第64-66页 |
·人名识别 | 第66-67页 |
·记者姓名的过滤 | 第67页 |
·搜狐语料新闻人物分布 | 第67-68页 |
·有效新闻识别方法 | 第68-69页 |
·有效新闻提取实验 | 第69-70页 |
·有效新闻识别对人物分类结果的影响 | 第70-74页 |
·实验语料 | 第71-72页 |
·实验过程 | 第72页 |
·实验结果分析 | 第72-74页 |
·本章小节 | 第74-75页 |
第4章 基于二分图的人物评价要素抽取 | 第75-98页 |
·形式化描述 | 第75页 |
·相关研究 | 第75-77页 |
·人工规则方法 | 第76页 |
·基于语料库和机器学习的方法 | 第76-77页 |
·语料 | 第77-78页 |
·分词与词性标注 | 第78页 |
·语料特征 | 第78页 |
·基于二分图的评价对象和评价词搭配抽取方法 | 第78-92页 |
·基于简单规则的评价对象和评价词种子抽取方法 | 第78-80页 |
·基于篇章PMI的评价对象词和评价词候选对筛选方法 | 第80-82页 |
·二分图 | 第82-84页 |
·基于二分图最大权完全匹配的评价对象和评价词关系抽取 | 第84-92页 |
·实验以及结果分析 | 第92-96页 |
·筛选过滤阈值计算 | 第92页 |
·抽取实验 | 第92-93页 |
·对比实验 | 第93-94页 |
·不同人物的评价要素抽取实验 | 第94-96页 |
·本章小结 | 第96-98页 |
第5章 总结与展望 | 第98-101页 |
·本文研究总结 | 第98-99页 |
·未来工作 | 第99-101页 |
参考文献 | 第101-109页 |
攻读学位期间完成的论文以及科研工作 | 第109-111页 |
攻读学位期间参与的科研项目 | 第111-112页 |
致谢 | 第112-113页 |