基于知网语义相似度的中文文本聚类方法研究
| 摘要 | 第1-4页 |
| ABSTRACT | 第4-8页 |
| 第一章 绪论 | 第8-12页 |
| ·研究背景与意义 | 第8-9页 |
| ·文本聚类的发展和研究现状 | 第9-11页 |
| ·论文的主要研究内容 | 第11页 |
| ·论文结构和安排 | 第11-12页 |
| 第二章 中文文本聚类的关键技术 | 第12-28页 |
| ·文本聚类 | 第12-14页 |
| ·文本聚类的形式化描述 | 第12页 |
| ·文本聚类过程 | 第12-13页 |
| ·文本聚类的应用领域 | 第13-14页 |
| ·中文文本聚类的关键技术 | 第14-21页 |
| ·文本自动分词技术 | 第14-15页 |
| ·特征选取 | 第15-17页 |
| ·文本表示 | 第17页 |
| ·文本间的距离和相似度度量 | 第17-20页 |
| ·聚类算法 | 第20-21页 |
| ·语义词典--知网 | 第21-26页 |
| ·知网基本概念 | 第21-23页 |
| ·基于知网的词语相似度计算 | 第23-26页 |
| ·小结 | 第26-28页 |
| 第三章 基于知网语义相似度的文本聚类模型构建 | 第28-40页 |
| ·基于词性的文本预处理 | 第28-30页 |
| ·构建基于语义特征的文本表示模型 | 第30-34页 |
| ·文本特征提取 | 第30-33页 |
| ·建立文本表示模型 | 第33-34页 |
| ·文本相似度度量 | 第34-36页 |
| ·文本与文本之间的相似度度量 | 第34-35页 |
| ·簇特征提取 | 第35-36页 |
| ·文本与文本簇之间的相似度度量 | 第36页 |
| ·基于知网语义相似度的文本聚类算法设计 | 第36-40页 |
| 第四章 实验及结果分析 | 第40-50页 |
| ·特征降维实验 | 第40-42页 |
| ·文本相似度计算实验 | 第42-43页 |
| ·文本聚类实验 | 第43-48页 |
| ·聚类效果比较 | 第48-50页 |
| 第五章 总结和展望 | 第50-52页 |
| ·总结 | 第50页 |
| ·展望 | 第50-52页 |
| 致谢 | 第52-54页 |
| 参考文献 | 第54-58页 |
| 作者在攻读硕士期间的科研成果 | 第58-59页 |