文本主题域划分与无监督特征提取
提要 | 第1-10页 |
第1章 绪论 | 第10-21页 |
·问题的提出 | 第10-11页 |
·选题背景及意义 | 第11-13页 |
·文本聚类介绍及研究现状分析 | 第13-19页 |
·文本聚类的定义 | 第13页 |
·文本聚类的步骤 | 第13-14页 |
·主题域划分 | 第14页 |
·权重计算与特征提取 | 第14-16页 |
·模型与聚类 | 第16页 |
·性能评价 | 第16-18页 |
·数据集 | 第18-19页 |
·本文的研究重点与内容安排 | 第19-21页 |
第2章 文本表示模型 | 第21-34页 |
·现有的文本表示模型 | 第21-26页 |
·布尔模型 | 第21-22页 |
·向量空间模型 | 第22-24页 |
·统计语言模型 | 第24-25页 |
·词序列模型 | 第25-26页 |
·现有的文本表示模型的比较 | 第26页 |
·中文特征项的粒度 | 第26-27页 |
·特征项关联要素分析 | 第27-29页 |
·语义量子 | 第29-31页 |
·主题概念模型 | 第31-32页 |
·显量子表示模型 | 第31-32页 |
·潜量子表示模型 | 第32页 |
·本章小结 | 第32-34页 |
第3章 文本主题域划分 | 第34-46页 |
·为什么主题域划分 | 第34-35页 |
·主题域划分相关工作 | 第35-37页 |
·基于最优化控制的主题域划分模型 | 第37-42页 |
·最优化控制模型 | 第37-38页 |
·目标函数的构造 | 第38-41页 |
·模型求解算法 | 第41-42页 |
·实验与分析 | 第42-44页 |
·测试集 | 第43页 |
·评价方法 | 第43-44页 |
·实验结果与分析 | 第44页 |
·相关研究对比 | 第44-45页 |
·本章小结 | 第45-46页 |
第4章 文本特征提取 | 第46-65页 |
·文本提取相关概念 | 第46-49页 |
·特征提取的定义 | 第46-47页 |
·为什么要特征提取 | 第47-48页 |
·特征项的粒度 | 第48-49页 |
·特征提取的分类 | 第49页 |
·特征提取的过程 | 第49页 |
·特征提取研究现状 | 第49-53页 |
·现有的无监督特征提取方法 | 第50-53页 |
·现有方法存在的问题 | 第53页 |
·基于主题域模式的文本特征提取 | 第53-64页 |
·显量子权重计算 | 第54-55页 |
·潜量子权重计算 | 第55-62页 |
·主题域概念模式 | 第62页 |
·实验及结论 | 第62-64页 |
·本章小结 | 第64-65页 |
第5章 总结和展望 | 第65-67页 |
·论文的主要贡献 | 第65-66页 |
·进一步工作展望 | 第66-67页 |
参考文献 | 第67-75页 |
攻读博士学位期间发表的学术论文 | 第75-76页 |
致谢 | 第76-77页 |
中文摘要 | 第77-79页 |
ABSTRACT | 第79-81页 |