首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于后缀树的中文文本聚类算法研究

引言第1-9页
第1章 绪论第9-20页
 1.1 数据挖掘技术介绍第9-11页
  1.1.1 数据挖掘的涵义第9-10页
  1.1.2 数据挖掘的过程第10-11页
  1.1.3 数据挖掘的主要方法第11页
 1.2 文本挖掘第11-14页
  1.2.1 文本挖掘的涵义第12页
  1.2.2 文本挖掘的过程第12页
  1.2.3 文本挖掘的应用背景第12-13页
  1.2.4 文本挖掘的产品及应用第13-14页
 1.3 本文的研究方向和意义第14-19页
  1.3.1 聚类研究的现状第14-17页
  1.3.2 本文研究的意义第17-18页
  1.3.3 本文的研究工作第18-19页
 1.4 小结第19-20页
第2章 文本聚类技术研究第20-27页
 2.1 文本聚类的过程第20-22页
  2.1.1 文本表示第20页
  2.1.2 特征降维第20-21页
  2.1.3 文本聚类算法的选取第21页
  2.1.4 评价聚类结果的质量第21-22页
 2.2 文本聚类的主要算法第22-26页
  2.2.1 层次凝聚法第22-23页
  2.2.2 平面划分法第23-24页
  2.2.3 K最近邻参数聚类算法第24页
  2.2.4 自组织映射神经网络SOM第24-25页
  2.2.5 基于概念的文本聚类第25页
  2.2.6 学习矢量量化的聚类方法第25-26页
 2.3 小结第26-27页
第3章 中文文本聚类若干关键技术探讨第27-34页
 3.1 分词技术第28页
 3.2 文本表示第28-30页
 3.3 特征降维第30-31页
 3.4 权重评价第31-32页
 3.5 相似度计算第32-33页
 3.6 小结第33-34页
第4章 中文文本聚类系统的设计与实现第34-55页
 4.1 K-平均聚类算法第35-41页
  4.1.1 算法介绍第35-37页
  4.1.2 系统结构第37-38页
  4.1.3 程序实现第38-41页
 4.2 基于 STC的中文文本算法第41-51页
  4.2.1 算法介绍第41-47页
  4.2.2 系统结构第47-49页
  4.2.3 程序实现第49-51页
 4.3 试验数据的对比和评价第51-54页
 4.4 小结第54-55页
第5章 总结及展望第55-57页
 5.1 本文总结第55页
 5.2 进一步研究工作展望第55-57页
致谢第57-58页
参考文献第58-62页
附录 A第62-63页
附录 B第63-64页

论文共64页,点击 下载论文
上一篇:雌激素对过氧化氢诱导大鼠晶状体上皮细胞调亡的抑制作用的实验研究
下一篇:复合氧化物负载的镍基催化剂上甲烷二氧化碳重整反应及其机理研究