摘要 | 第5-7页 |
ABSTRACT | 第7-8页 |
第一章 绪论 | 第12-20页 |
1.1 研究的背景及意义 | 第12-13页 |
1.2 国内外研究现状及分析 | 第13-16页 |
1.2.1 隐马尔可夫模型研究进展 | 第13-14页 |
1.2.2 评价挖掘研究进展 | 第14-16页 |
1.3 电商商品评价的一些特点 | 第16-18页 |
1.4 论文的主要工作 | 第18页 |
1.5 论文的结构 | 第18-20页 |
第二章 评价挖掘的典型模型 | 第20-39页 |
2.1 引言 | 第20页 |
2.2 基于点互信息计算模型 | 第20-21页 |
2.3 最大熵马尔可夫模型 | 第21-23页 |
2.3.1 熵的定义 | 第21-22页 |
2.3.2 最大熵原理 | 第22页 |
2.3.3 最大熵马尔科夫模型 | 第22-23页 |
2.4 隐马尔可夫模型 | 第23-32页 |
2.4.1 全概率公式和贝叶斯公式 | 第24-25页 |
2.4.2 贝叶斯方法与中文分词 | 第25-26页 |
2.4.3 马尔科夫模型 | 第26-27页 |
2.4.4 隐马尔可夫模型 | 第27-32页 |
2.5 条件随机场模型 | 第32-38页 |
2.5.1 条件随机场的定义 | 第32-33页 |
2.5.2 条件随机场的参数化形式 | 第33-34页 |
2.5.3 条件随机场的简化形式 | 第34-35页 |
2.5.4 条件随机场的矩阵形式 | 第35页 |
2.5.5 条件随机场的三个基本问题及求解 | 第35-38页 |
2.6 四种模型的比较 | 第38页 |
2.7 本章小结 | 第38-39页 |
第三章 基于词性词汇的隐马尔可夫模型 | 第39-52页 |
3.1 引言 | 第39页 |
3.2 与词性词汇相关的隐马尔科夫模型 | 第39-42页 |
3.2.1 基于点互信息模型的局限性 | 第39-40页 |
3.2.2 隐马尔可夫模型与条件随机场模型的局限性 | 第40页 |
3.2.3 与词性词汇相关的隐马尔科夫模型 | 第40-42页 |
3.3 模型的训练与计算 | 第42-51页 |
3.3.1 参数训练问题 | 第42-44页 |
3.3.2 零概率问题 | 第44-47页 |
3.3.3 未登录词过多的问题 | 第47-48页 |
3.3.4 浮点数下溢问题 | 第48页 |
3.3.5 模型的计算 | 第48-50页 |
3.3.6 同义词近义词问题 | 第50-51页 |
3.4 本章小结 | 第51-52页 |
第四章 模型训练与效果优化 | 第52-72页 |
4.1 引言 | 第52-53页 |
4.2 原始语料准备与预处理 | 第53-60页 |
4.2.1 目标数据概况 | 第53-54页 |
4.2.2 目标数据的获取 | 第54-57页 |
4.2.3 最小切割法分词 | 第57-58页 |
4.2.4 减少未登录词数量 | 第58-60页 |
4.3 训练数据的人工标注 | 第60-64页 |
4.3.1 训练数据的人工标注规则 | 第60-61页 |
4.3.2 人工标注TAG的组成 | 第61-62页 |
4.3.3 人工标注TAG的标准 | 第62-63页 |
4.3.4 训练数据的人工标注 | 第63-64页 |
4.4 训练数据产出 | 第64-66页 |
4.5 模型训练的自学习过程 | 第66页 |
4.6 中文评价挖掘 | 第66-70页 |
4.6.1 评价的情感极性判定 | 第67-68页 |
4.6.2 评价对象提取 | 第68-69页 |
4.6.3 同义词与近义词的合并 | 第69-70页 |
4.7 本章小结 | 第70-72页 |
第五章 实验与分析 | 第72-78页 |
5.1 引言 | 第72页 |
5.2 模型评价指标介绍 | 第72-73页 |
5.3 模型评价实验过程与评测 | 第73-77页 |
5.4 本章小结 | 第77-78页 |
第六章 工作总结与展望 | 第78-80页 |
6.1 工作总结 | 第78-79页 |
6.2 工作展望 | 第79-80页 |
致谢 | 第80-81页 |
参考文献 | 第81-85页 |
攻读硕士期间的成果 | 第85页 |