面向网络评论的观点分析技术
摘要 | 第6-8页 |
ABSTRACT | 第8-9页 |
第一章 引言 | 第15-23页 |
1.1 研究背景 | 第15-20页 |
1.1.1 观点分析的主要研究内容 | 第15-18页 |
1.1.2 观点分析技术的应用现状和前景 | 第18-19页 |
1.1.3 观点分析研究面临的挑战 | 第19-20页 |
1.2 本文的主要贡献 | 第20-21页 |
1.3 本文章节的安排 | 第21-23页 |
第二章 背景知识与相关领域研究现状 | 第23-43页 |
2.1 观点文本的质量控制 | 第23-28页 |
2.1.1 输入约束或政策激励 | 第23-24页 |
2.1.2 评论质量的评估 | 第24-26页 |
2.1.3 垃圾评论的检测 | 第26-28页 |
2.2 观点识别 | 第28-34页 |
2.2.1 词语级别的观点识别 | 第28-30页 |
2.2.2 文档级别的观点识别 | 第30-32页 |
2.2.3 商品特征的观点识别 | 第32-34页 |
2.3 观点分析中常用技术和评价指标 | 第34-39页 |
2.3.1 常用的方法和模型 | 第34-36页 |
2.3.2 常用的评价指标 | 第36-39页 |
2.4 观点分析中常用的评论数据集 | 第39-41页 |
2.5 本章小结 | 第41-43页 |
第三章 面向观点识别的特征表示方法 | 第43-57页 |
3.1 问题定义 | 第43-45页 |
3.2 传统特征表示方法中存在的局限 | 第45-47页 |
3.3 词项的情感信息量化 | 第47-48页 |
3.4 识别文档的观点极性 | 第48-50页 |
3.5 实验与结果分析 | 第50-55页 |
3.5.1 实验数据和设置 | 第50-51页 |
3.5.2 结果与分析 | 第51-55页 |
3.6 本章小结 | 第55-57页 |
第四章 面向观点识别的集成学习模型 | 第57-69页 |
4.1 传统单分类器方法的局限 | 第57-58页 |
4.2 基于集成学习的观点识别框架 | 第58-60页 |
4.3 成员分类器组的质量评估机制 | 第60-62页 |
4.4 基于stacking的多分类器集成算法 | 第62-63页 |
4.5 实验与结果分析 | 第63-67页 |
4.5.1 实验数据和设置 | 第63-64页 |
4.5.2 结果与分析 | 第64-67页 |
4.6 本章小结 | 第67-69页 |
第五章 集成学习模型中成员分类器的优化选择技术 | 第69-87页 |
5.1 分类器组选择策略优化的必要性 | 第69页 |
5.2 成员分类器组的近似最优选择策略 | 第69-75页 |
5.2.1 成员分类器选择的贪心算法 | 第70-75页 |
5.2.2 CSGA的时间复杂度分析 | 第75页 |
5.3 实验与结果分析 | 第75-85页 |
5.3.1 实验数据和设置 | 第75-77页 |
5.3.2 结果与分析 | 第77-85页 |
5.4 本章小结 | 第85-87页 |
第六章 垃圾评论的在线检测技术 | 第87-105页 |
6.1 垃圾评论检测的问题描述 | 第87-89页 |
6.2 垃圾评论的检测模型 | 第89-94页 |
6.2.1 评论内容的建模 | 第89-93页 |
6.2.2 评论人行为的建模 | 第93-94页 |
6.3 垃圾评论的在线检测算法 | 第94-97页 |
6.3.1 有监督的垃圾评论在线检测算法 | 第95-96页 |
6.3.2 无监督的垃圾评论在线检测算法 | 第96-97页 |
6.4 实验与结果分析 | 第97-104页 |
6.4.1 数据准备和评价标准 | 第97-100页 |
6.4.2 结果与分析 | 第100-104页 |
6.5 本章小结 | 第104-105页 |
第七章 总结与展望 | 第105-109页 |
7.1 总结 | 第105-107页 |
7.2 未来工作展望 | 第107-109页 |
参考文献 | 第109-121页 |
攻读博士学位期间的论文成果 | 第121-123页 |
致谢 | 第123-125页 |
附录A 部分提供与观点分析相关功能的网站 | 第125页 |