文本主题域划分与无监督特征提取
| 提要 | 第1-10页 |
| 第1章 绪论 | 第10-21页 |
| ·问题的提出 | 第10-11页 |
| ·选题背景及意义 | 第11-13页 |
| ·文本聚类介绍及研究现状分析 | 第13-19页 |
| ·文本聚类的定义 | 第13页 |
| ·文本聚类的步骤 | 第13-14页 |
| ·主题域划分 | 第14页 |
| ·权重计算与特征提取 | 第14-16页 |
| ·模型与聚类 | 第16页 |
| ·性能评价 | 第16-18页 |
| ·数据集 | 第18-19页 |
| ·本文的研究重点与内容安排 | 第19-21页 |
| 第2章 文本表示模型 | 第21-34页 |
| ·现有的文本表示模型 | 第21-26页 |
| ·布尔模型 | 第21-22页 |
| ·向量空间模型 | 第22-24页 |
| ·统计语言模型 | 第24-25页 |
| ·词序列模型 | 第25-26页 |
| ·现有的文本表示模型的比较 | 第26页 |
| ·中文特征项的粒度 | 第26-27页 |
| ·特征项关联要素分析 | 第27-29页 |
| ·语义量子 | 第29-31页 |
| ·主题概念模型 | 第31-32页 |
| ·显量子表示模型 | 第31-32页 |
| ·潜量子表示模型 | 第32页 |
| ·本章小结 | 第32-34页 |
| 第3章 文本主题域划分 | 第34-46页 |
| ·为什么主题域划分 | 第34-35页 |
| ·主题域划分相关工作 | 第35-37页 |
| ·基于最优化控制的主题域划分模型 | 第37-42页 |
| ·最优化控制模型 | 第37-38页 |
| ·目标函数的构造 | 第38-41页 |
| ·模型求解算法 | 第41-42页 |
| ·实验与分析 | 第42-44页 |
| ·测试集 | 第43页 |
| ·评价方法 | 第43-44页 |
| ·实验结果与分析 | 第44页 |
| ·相关研究对比 | 第44-45页 |
| ·本章小结 | 第45-46页 |
| 第4章 文本特征提取 | 第46-65页 |
| ·文本提取相关概念 | 第46-49页 |
| ·特征提取的定义 | 第46-47页 |
| ·为什么要特征提取 | 第47-48页 |
| ·特征项的粒度 | 第48-49页 |
| ·特征提取的分类 | 第49页 |
| ·特征提取的过程 | 第49页 |
| ·特征提取研究现状 | 第49-53页 |
| ·现有的无监督特征提取方法 | 第50-53页 |
| ·现有方法存在的问题 | 第53页 |
| ·基于主题域模式的文本特征提取 | 第53-64页 |
| ·显量子权重计算 | 第54-55页 |
| ·潜量子权重计算 | 第55-62页 |
| ·主题域概念模式 | 第62页 |
| ·实验及结论 | 第62-64页 |
| ·本章小结 | 第64-65页 |
| 第5章 总结和展望 | 第65-67页 |
| ·论文的主要贡献 | 第65-66页 |
| ·进一步工作展望 | 第66-67页 |
| 参考文献 | 第67-75页 |
| 攻读博士学位期间发表的学术论文 | 第75-76页 |
| 致谢 | 第76-77页 |
| 中文摘要 | 第77-79页 |
| ABSTRACT | 第79-81页 |