首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--一般性问题论文--理论、方法论文--算法理论论文

基于特征词的文本聚类算法研究

摘要第1-4页
ABSTRACT第4-6页
目录第6-8页
第1章 绪论第8-17页
   ·研究背景和选题意义第8-9页
   ·国内外研究现状第9-11页
   ·文本数据挖掘概述第11-16页
     ·文本挖掘的含义第11-12页
     ·文本挖掘与数据挖掘第12-13页
     ·文本挖掘研究的内容第13-14页
     ·文本挖掘中的课题第14-16页
   ·主要内容及组织结构第16-17页
第2章 文本聚类预处理关键技术的讨论第17-31页
   ·文本预处理第17-20页
     ·分词第17-19页
     ·停用词处理第19页
     ·同义词归并第19-20页
   ·文本特征表示第20-22页
     ·布尔逻辑模型第20页
     ·向量空间模型第20-21页
     ·其它模型第21-22页
   ·特征选择方法第22-25页
     ·特征项选择原则第22-23页
     ·基于评估函数的特征选择第23-25页
   ·特征权重计算的研究和改进第25-28页
     ·特征项权重计算函数第25-27页
     ·对TF-IDF的改进第27-28页
   ·文本相似度计算第28-29页
   ·本章小结第29-31页
第3章 常用的文本聚类算法分析第31-44页
   ·基于划分的方法第31-33页
   ·基于层次的方法第33-35页
   ·基于密度的方法第35-37页
   ·基于网格的方法第37-38页
   ·基于模型的方法第38-39页
   ·文本聚类算法的比较标准第39-43页
   ·本章小结第43-44页
第4章 基于topN特征词的文本聚类算法第44-55页
   ·验证改进后的TF-IDF权重计算方法第44-47页
   ·特征降维topN方法及其验证第47-50页
     ·特征降维topN方法第47-48页
     ·实验过程及结果分析第48-50页
   ·基于topN特征词的文本聚类算法第50-53页
     ·初始聚类中心的优化思想第51-52页
     ·基于topN特征词的文本聚类算法描述第52-53页
     ·实验过程与结果分析第53页
   ·本章小结第53-55页
总结与展望第55-57页
致谢第57-58页
参考文献第58-63页
攻读硕士学位期间发表的论文及科研项目第63页

论文共63页,点击 下载论文
上一篇:复合伸缩多尺度分析尺度函数的特征刻划
下一篇:基于DM642的运动目标识别与跟踪