基于相关主题模型的文本分类方法研究
中文摘要 | 第1-5页 |
Abstract | 第5-10页 |
第一章 绪论 | 第10-14页 |
·研究背景及意义 | 第10-11页 |
·国内外研究现状 | 第11-12页 |
·本文研究工作 | 第12-13页 |
·本文的内容安排 | 第13-14页 |
第二章 文本分类概述 | 第14-32页 |
·文本分类问题描述 | 第14-15页 |
·文本分类的关键技术 | 第15-29页 |
·文本分类预处理 | 第15-16页 |
·文本特征选择技术 | 第16-19页 |
·文本表示模型 | 第19-22页 |
·常用的文本分类方法 | 第22-29页 |
·文本分类技术的应用 | 第29-31页 |
·本章小结 | 第31-32页 |
第三章 CTM 模型 | 第32-41页 |
·基本概念和理论 | 第32页 |
·LDA 模型 | 第32-35页 |
·Dirichlet 分布 | 第32-33页 |
·LDA 模型的基本思想 | 第33-35页 |
·LDA 模型文档产生过程 | 第35页 |
·CTM 模型 | 第35-39页 |
·CTM 模型简介 | 第35-36页 |
·Logistic Normal 分布 | 第36-37页 |
·CTM 文档生成过程 | 第37页 |
·CTM 模型参数估计 | 第37-38页 |
·CTM 模型后验推理 | 第38-39页 |
·CTM 模型应用在文本分类中的优缺点 | 第39-40页 |
·本章小结 | 第40-41页 |
第四章 CTM 模型优化 | 第41-49页 |
·聚类基础知识 | 第41-42页 |
·聚类的定义 | 第41页 |
·常用的聚类方法 | 第41-42页 |
·基于密度的聚类方法 | 第42-45页 |
·基本概念 | 第43-44页 |
·DBSCAN 算法步骤及优点 | 第44-45页 |
·基于聚类的CTM 模型优化方法 | 第45页 |
·实验设计及结果分析 | 第45-47页 |
·实验1 | 第45-46页 |
·实验2 | 第46-47页 |
·本章小结 | 第47-49页 |
第五章 CTM 模型的特征提取 | 第49-55页 |
·互信息及改进的互信息 | 第49-50页 |
·互信息 | 第49页 |
·改进的互信息 | 第49-50页 |
·遗传算法与改进互信息相结合的特征提取 | 第50-52页 |
·遗传算法简介 | 第50-51页 |
·遗传算法的特点 | 第51页 |
·CTM 模型的特征提取 | 第51-52页 |
·实验设计及结果分析 | 第52-54页 |
·本章小结 | 第54-55页 |
第六章 总结与展望 | 第55-57页 |
·本文研究内容总结 | 第55-56页 |
·未来工作展望 | 第56-57页 |
参考文献 | 第57-62页 |
攻读硕士学位期间发表学术论文情况 | 第62-63页 |
致谢 | 第63-64页 |