摘要 | 第3-5页 |
abstract | 第5-6页 |
主要符号索引 | 第9-11页 |
第一章 绪论 | 第11-19页 |
1.1 选题背景及意义 | 第11-12页 |
1.2 研究现状 | 第12-14页 |
1.2.1 全覆盖粒计算理论的研究现状 | 第12-13页 |
1.2.2 面向新闻文档的子话题划分研究现状 | 第13-14页 |
1.3 本文的研究内容 | 第14-15页 |
1.4 本文的组织结构 | 第15-19页 |
第二章 基本模型及理论 | 第19-31页 |
2.1 LDA主题模型 | 第19-23页 |
2.1.1 LDA主题模型理论 | 第19-21页 |
2.1.2 LDA主题模型具体步骤 | 第21-22页 |
2.1.3 LDA主题模型应用 | 第22-23页 |
2.2 文本的全覆盖表示模型 | 第23-28页 |
2.2.1 全覆盖粒计算理论 | 第23-24页 |
2.2.2 文本的全覆盖表示模型 | 第24-27页 |
2.2.3 冗余覆盖元的约简 | 第27-28页 |
2.3 本章小结 | 第28-31页 |
第三章 传统的面向新闻文档的子话题划分方法 | 第31-39页 |
3.1 增量聚类算法Single-Pass(SP) | 第31-33页 |
3.1.1 Single-Pass算法基本思想 | 第31-32页 |
3.1.2 Single-Pass算法具体流程及步骤 | 第32-33页 |
3.2 子话题相关定义及已有划分方法 | 第33-37页 |
3.2.1 子话题相关定义 | 第34页 |
3.2.2 子话题划分已有方法 | 第34-37页 |
3.3 本章小结 | 第37-39页 |
第四章 基于全覆盖粒计算的新闻文档的子话题划分方法 | 第39-49页 |
4.1 诱导划分算法 | 第39-44页 |
4.1.1 诱导划分算法理论 | 第39-40页 |
4.1.2 诱导划分算法过程 | 第40-43页 |
4.1.3 诱导划分算法优化 | 第43-44页 |
4.2 基于LDA和DP的子话题划分方法 | 第44-48页 |
4.2.1 LDA和DP用于子话题划分的优点 | 第45-46页 |
4.2.2 基于LDA和DP的子话题划分的具体步骤 | 第46-48页 |
4.3 本章小结 | 第48-49页 |
第五章 实验与结果分析 | 第49-62页 |
5.1 实验准备 | 第49-53页 |
5.1.1 实验环境 | 第49页 |
5.1.2 实验语料 | 第49-52页 |
5.1.3 实验评价指标 | 第52-53页 |
5.2 实验设计与结果分析 | 第53-61页 |
5.2.1 最优主题个数选取及θ阈值确定 | 第53-55页 |
5.2.2 与传统方法对比实验 | 第55-57页 |
5.2.3 与经典Single-Pass方法对比实验 | 第57-60页 |
5.2.4 在其它主题语料库上的实验分析 | 第60-61页 |
5.3 本章小结 | 第61-62页 |
第六章 总结与展望 | 第62-65页 |
6.1 全文总结 | 第62页 |
6.2 研究展望 | 第62-65页 |
参考文献 | 第65-69页 |
致谢 | 第69-71页 |
攻读硕士学位期间发表的论文 | 第71页 |