摘要 | 第5-6页 |
ABSTRACT | 第6-7页 |
目录 | 第8-10页 |
第一章 绪论 | 第10-14页 |
1.1 研究背景与意义 | 第10页 |
1.2 研究现状及发展趋势 | 第10-12页 |
1.2.1 基于词和短语的情感分类 | 第10-11页 |
1.2.2 基于文档和句子的情感分类 | 第11-12页 |
1.2.3 基于特征的情感分类 | 第12页 |
1.3 研究思路与内容 | 第12-13页 |
1.3.1 研究思路 | 第12-13页 |
1.3.2 研究内容 | 第13页 |
1.4 本文的组织 | 第13-14页 |
第二章 相关工作及研究进展 | 第14-28页 |
2.1 文本预处理 | 第14-15页 |
2.1.1 中文分词 | 第14-15页 |
2.1.2 过滤停用词和噪声 | 第15页 |
2.2 狄利克雷分布和狄利克雷过程 | 第15-18页 |
2.2.1 共轭先验 | 第16-18页 |
2.3 文本建模 | 第18-26页 |
2.3.1 布尔模型 | 第19页 |
2.3.2 向量空间模型 | 第19-20页 |
2.3.3 N-Gram 模型 | 第20-22页 |
2.3.4 pLSA 模型 | 第22-23页 |
2.3.5 主题模型 | 第23-26页 |
2.4 Gibbs Sampling 抽样算法简介 | 第26页 |
2.5 非参数贝叶斯 | 第26-27页 |
2.6 本章小结 | 第27-28页 |
第三章 基于扩展主题模型的情感分类模型 | 第28-43页 |
3.1 基于主题模型的其他情感分类模型 | 第28-29页 |
3.2 准备工作 | 第29-30页 |
3.3 我的工作 | 第30-32页 |
3.3.1 生成过程 | 第30-31页 |
3.3.2 参数推断 | 第31-32页 |
3.4 实验结果以及实验分析 | 第32-43页 |
3.4.1 实验数据准备 | 第32-35页 |
3.4.2 评估方法 | 第35-36页 |
3.4.3 结果分析 | 第36-41页 |
3.4.4 结论 | 第41-42页 |
3.4.5 展望 | 第42-43页 |
第四章 基于 DDCRP 的评论主题数聚类 | 第43-51页 |
4.1 文本聚类 | 第43-45页 |
4.1.1 文本聚类简介 | 第43页 |
4.1.2 文本聚类方法 | 第43-44页 |
4.1.3 聚类工作 | 第44-45页 |
4.2 准备工作与相关工作 | 第45-47页 |
4.2.1 狄利克雷过程 | 第45页 |
4.2.2 狄利克雷过程混合模型(DPMM) | 第45页 |
4.2.3 语义相似度、词语距离 | 第45-46页 |
4.2.4 知网简介 | 第46-47页 |
4.2.5 相关工作 | 第47页 |
4.3 DDCRP | 第47-48页 |
4.3.1 准备工作 | 第47-48页 |
4.4 参数推断 | 第48-49页 |
4.4.1 数据建模 | 第48-49页 |
4.4.2 后验概率推断 | 第49页 |
4.5 实验结果 | 第49-50页 |
4.6 总结与展望 | 第50-51页 |
第五章 总结与展望 | 第51-53页 |
5.1 研究工作总结 | 第51-52页 |
5.2 未来展望 | 第52-53页 |
致谢 | 第53-54页 |
参考文献 | 第54-59页 |
附录 | 第59-60页 |
详细摘要 | 第60-63页 |