| 中文摘要 | 第1-6页 |
| Abstract | 第6-12页 |
| 第1章 绪论 | 第12-31页 |
| ·背景与意义 | 第12-14页 |
| ·文本情感分析发展概况 | 第14-27页 |
| ·基于词典的情感分析 | 第14-20页 |
| ·基于语料库的情感分析 | 第20-23页 |
| ·情感分析常用机器学习算法 | 第23-27页 |
| ·人物评价文本情感分析 | 第27页 |
| ·本文的研究内容与组织结构 | 第27-31页 |
| ·研究内容 | 第28-29页 |
| ·组织结构 | 第29-31页 |
| 第2章 人物评价文本语料库建设 | 第31-46页 |
| ·引言 | 第31-32页 |
| ·相关研究 | 第32-34页 |
| ·专用语料库建设 | 第32-33页 |
| ·多分类器融合 | 第33页 |
| ·主动学习 | 第33-34页 |
| ·人物评价语料采集 | 第34-36页 |
| ·人物评价语料的选取 | 第35页 |
| ·语料预处理 | 第35页 |
| ·人物评价语料的特征 | 第35-36页 |
| ·基于保守投票规则的多分类器融合的语料标注方法 | 第36-37页 |
| ·一个基于主动学习的专用语料库生成方法 | 第37-42页 |
| ·脏话处理的意义 | 第38-39页 |
| ·脏话的定义 | 第39页 |
| ·高精度分类器 | 第39-41页 |
| ·特殊数据过滤 | 第41页 |
| ·特征筛选 | 第41-42页 |
| ·实验以及结果分析 | 第42-45页 |
| ·小结 | 第45-46页 |
| 第3章 基于知识库和搜索引擎的人物分类 | 第46-75页 |
| ·相关研究 | 第46-48页 |
| ·两层架构的人物分类方法 | 第48-49页 |
| ·人物分类语料 | 第49-54页 |
| ·百度百科语料 | 第49-50页 |
| ·新闻语料 | 第50-54页 |
| ·基于知识库的人物分类 | 第54-62页 |
| ·采用词组作为特征 | 第54-61页 |
| ·采用词组加词性作为特征 | 第61-62页 |
| ·采用平均值筛选特征分类 | 第62页 |
| ·实验结果分析 | 第62页 |
| ·基于新闻的人物分类 | 第62-70页 |
| ·主题模型与LDA模型 | 第63-64页 |
| ·有效新闻以及“噪声新闻” | 第64-66页 |
| ·人名识别 | 第66-67页 |
| ·记者姓名的过滤 | 第67页 |
| ·搜狐语料新闻人物分布 | 第67-68页 |
| ·有效新闻识别方法 | 第68-69页 |
| ·有效新闻提取实验 | 第69-70页 |
| ·有效新闻识别对人物分类结果的影响 | 第70-74页 |
| ·实验语料 | 第71-72页 |
| ·实验过程 | 第72页 |
| ·实验结果分析 | 第72-74页 |
| ·本章小节 | 第74-75页 |
| 第4章 基于二分图的人物评价要素抽取 | 第75-98页 |
| ·形式化描述 | 第75页 |
| ·相关研究 | 第75-77页 |
| ·人工规则方法 | 第76页 |
| ·基于语料库和机器学习的方法 | 第76-77页 |
| ·语料 | 第77-78页 |
| ·分词与词性标注 | 第78页 |
| ·语料特征 | 第78页 |
| ·基于二分图的评价对象和评价词搭配抽取方法 | 第78-92页 |
| ·基于简单规则的评价对象和评价词种子抽取方法 | 第78-80页 |
| ·基于篇章PMI的评价对象词和评价词候选对筛选方法 | 第80-82页 |
| ·二分图 | 第82-84页 |
| ·基于二分图最大权完全匹配的评价对象和评价词关系抽取 | 第84-92页 |
| ·实验以及结果分析 | 第92-96页 |
| ·筛选过滤阈值计算 | 第92页 |
| ·抽取实验 | 第92-93页 |
| ·对比实验 | 第93-94页 |
| ·不同人物的评价要素抽取实验 | 第94-96页 |
| ·本章小结 | 第96-98页 |
| 第5章 总结与展望 | 第98-101页 |
| ·本文研究总结 | 第98-99页 |
| ·未来工作 | 第99-101页 |
| 参考文献 | 第101-109页 |
| 攻读学位期间完成的论文以及科研工作 | 第109-111页 |
| 攻读学位期间参与的科研项目 | 第111-112页 |
| 致谢 | 第112-113页 |