摘要 | 第1-4页 |
Abstract | 第4-7页 |
绪论 | 第7-12页 |
一 研究背景与意义 | 第7-8页 |
二 国内外研究现状 | 第8-11页 |
三 论文的主要内容及成果 | 第11-12页 |
第一章 文本聚类技术 | 第12-30页 |
·文本表示模型 | 第12-13页 |
·文本预处理 | 第13-24页 |
·分词 | 第13-15页 |
·词根还原 | 第15页 |
·停用词过滤 | 第15-16页 |
·降维技术 | 第16-20页 |
·权重计算 | 第20-22页 |
·相似度度量 | 第22-24页 |
·聚类技术 | 第24-25页 |
·基于划分的方法(partitioning method) | 第24页 |
·基于层次的算法(hierarchical method) | 第24-25页 |
·基于密度的算法(density-based method) | 第25页 |
·基于网格的算法(grid-based method) | 第25页 |
·基于模型的算法(model-based method) | 第25页 |
·可视化聚类算法(visualization-based method) | 第25页 |
·文本聚类有效性评价 | 第25-28页 |
本章小结 | 第28-30页 |
第二章 SOM神经网络的介绍 | 第30-39页 |
·人工神经网络概述 | 第30-31页 |
·SOM神经网络的提出 | 第31-32页 |
·SOM网络拓扑结构 | 第32-33页 |
·神经元的获胜策略 | 第33-34页 |
·SOM网络的学习策略 | 第34-36页 |
·SOM网络的特性 | 第36-37页 |
·SOM网络聚类的基本流程 | 第37页 |
·SOM网络聚类的优点及存在的问题 | 第37-38页 |
本章小结 | 第38-39页 |
第三章 改进的SOM聚类方法研究 | 第39-47页 |
·等离差学习策略 | 第39-43页 |
·已有的学习策略改进 | 第39-40页 |
·等离差理论在神经元获胜策略中的应用 | 第40-43页 |
·初始化连接权值 | 第43-45页 |
·已有的初始化连接权的方法 | 第43-44页 |
·新的确定初始权值的方法 | 第44-45页 |
·簇标引研究 | 第45-46页 |
本章小结 | 第46-47页 |
第四章 实验系统设计与数据分析 | 第47-60页 |
·文本聚类系统的设计与实现 | 第47-53页 |
·实验语料简介 | 第47-50页 |
·文本聚类的流程 | 第50-51页 |
·本系统的主要功能模块 | 第51页 |
·数据库设计 | 第51-53页 |
·实验数据分析 | 第53-59页 |
·实验文本数据集 | 第53-55页 |
·聚类结果比较 | 第55-58页 |
·聚类簇标引 | 第58-59页 |
本章小结 | 第59-60页 |
结论 | 第60-61页 |
参考文献 | 第61-64页 |
攻读硕士学位期间发表的学术论文 | 第64-65页 |
致谢 | 第65页 |