基于特定领域的汉语句子意见挖掘
摘要 | 第4-5页 |
ABSTRACT | 第5页 |
1 引言 | 第12-16页 |
1.1 课题的定义 | 第12-13页 |
1.2 目的和意义 | 第13-14页 |
1.3 本文的贡献 | 第14页 |
1.4 论文的组织结构 | 第14-16页 |
2 相关研究概述 | 第16-28页 |
2.1 主题抽取 | 第16-17页 |
2.2 陈述的选择 | 第17-19页 |
2.3 意见倾向分析 | 第19-22页 |
2.3.1 文本层 | 第19-20页 |
2.3.2 词汇、短语层 | 第20-21页 |
2.3.3 句子层 | 第21-22页 |
2.4 典型意见挖掘系统 | 第22-25页 |
2.4.1 Pulse | 第22-23页 |
2.4.2 WebFoundation | 第23-24页 |
2.4.3 Opinion Observer | 第24-25页 |
2.5 结论 | 第25-28页 |
3 汉语句子意见挖掘系统:OMS | 第28-36页 |
3.1 研究动机 | 第28-30页 |
3.2 任务分析 | 第30-31页 |
3.3 OMS 的系统结构 | 第31-34页 |
3.4 总结 | 第34-36页 |
4 基础资源构建 | 第36-46页 |
4.1 语料 | 第36-37页 |
4.2 标注 | 第37-41页 |
4.2.1 粗语料标注 | 第37-39页 |
4.2.2 模式标注 | 第39-41页 |
4.3 极性词词典 | 第41-46页 |
4.3.1 极性词的含义 | 第41页 |
4.3.2 词典构建 | 第41-42页 |
4.3.3 词典的局限性 | 第42-46页 |
5 陈述定界 | 第46-74页 |
5.1 单一/混合意见句的识别 | 第46-49页 |
5.2 主题抽取 | 第49-50页 |
5.3 陈述的细颗粒度分析 | 第50-64页 |
5.3.1 基于“投影映射”的模式生成 | 第54-58页 |
5.3.2 模式泛化 | 第58-60页 |
5.3.3 模式匹配 | 第60-64页 |
5.4 实验、分析和讨论 | 第64-73页 |
5.4.1 MCS 模块 | 第64-66页 |
5.4.2 FGCA 模块 | 第66-73页 |
5.5 结论 | 第73-74页 |
6 意见倾向分析 | 第74-95页 |
6.1 意见倾向与极性词的关系 | 第74-76页 |
6.2 核方法简介 | 第76-77页 |
6.3 基于核的意见倾向分类 | 第77-87页 |
6.3.1 极性分类任务分析 | 第77-79页 |
6.3.2 概念定义 | 第79-83页 |
6.3.3 语言学解释 | 第83-86页 |
6.3.4 意见倾向分类核函数 | 第86-87页 |
6.4 实验、分析和讨论 | 第87-94页 |
6.5 结论 | 第94-95页 |
7 结论及未来工作 | 第95-98页 |
7.1 总结 | 第95页 |
7.2 未来工作 | 第95-98页 |
参考文献 | 第98-103页 |
附录 | 第103-110页 |
致谢 | 第110-111页 |
攻读学位期间发表的学术论文 | 第111页 |