首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于近邻传播算法的中文文本聚类的研究

摘要第1-4页
ABSTRACT第4-6页
目录第6-8页
第1章 绪论第8-12页
   ·选题的背景及意义第8-10页
     ·数据挖掘概述第8-9页
     ·中文文本挖掘概述第9-10页
   ·聚类分析第10页
   ·文章结构安排第10-12页
第2章 文本预处理第12-20页
   ·文本分词方法第12-15页
     ·概述第12-13页
     ·中文分词特点及常见方法第13-15页
   ·ICTCLAS分词系统第15页
   ·文本预处理设计步骤第15-16页
   ·文本预处理结果第16-19页
   ·总结第19-20页
第3章 近邻传播算法第20-32页
   ·近邻传播算法描述第20-23页
     ·符号约定第20页
     ·相似度计算第20-21页
     ·两个重要数值的计算第21页
     ·聚类结果的计算第21-23页
   ·AP算法实现第23-25页
     ·阻尼系数λ和偏好参数p的说明第23页
     ·AP算法的实现第23-25页
   ·AP算法与Kmeans算法实验结果对比及分析第25-32页
     ·AP算法与k均值算法对比第26-27页
     ·AP算法与k均值算法实验对比第27-32页
第4章 相似度计算的调整及两重要系数的改进第32-43页
   ·概述第32页
   ·相似度计算方法的调整第32-35页
     ·符号约定第32页
     ·三个数据集定义第32-34页
     ·相似度的计算第34页
     ·改进的相似度的编程实现第34-35页
   ·阻尼系数λ和偏好参数p的改进第35-43页
     ·阻尼系数λ的改进第35-40页
     ·偏好参数p的改进第40-43页
第5章 文本聚类的实现及分析第43-47页
   ·中文文本聚类的实现第43-45页
   ·聚类结果分析第45-47页
第6章 总结和展望第47-49页
   ·研究工作总结第47页
   ·研究工作展望第47-49页
参考文献第49-51页
致谢第51-52页

论文共52页,点击 下载论文
上一篇:大跨度桥梁钢箱梁加劲板的动力行为研究
下一篇:高模量沥青及其混合料特性研究