首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

聚类分析在文本挖掘中的应用与研究

摘要第1-4页
ABSTRACT第4-7页
第一章 绪论第7-17页
   ·文本挖掘概述第7-10页
     ·文本挖掘的定义第7-8页
     ·文本挖掘的过程第8-9页
     ·文本挖掘的应用第9-10页
   ·文本挖掘的研究现状第10-14页
     ·文本特征表示第10-12页
     ·基于关键字的关联分析第12页
     ·文本分类第12-13页
     ·文本聚类第13-14页
   ·文本挖掘与相近领域的关系第14-16页
     ·自然语言处理与文本挖掘的区别第14-15页
     ·文本挖掘与相关领域的交叉第15-16页
   ·论文内容的安排第16-17页
第二章 聚类分析第17-36页
   ·聚类分析的概述第17-22页
     ·聚类分析定义第17页
     ·聚类分析的应用第17-19页
     ·距离与相似系数第19-20页
     ·聚类的特征与聚类间的距离第20-22页
   ·聚类分析的数据类型第22-27页
     ·区间标度变量第23-24页
     ·二元变量第24-25页
     ·标称型、序数型和比例标度型变量第25-26页
     ·混合类型的变量第26-27页
   ·聚类分析方法第27-34页
     ·分层聚类法第27-29页
     ·分割聚类算法第29-32页
     ·基于密度的方法第32-33页
     ·基于网格的方法第33页
     ·基于模型的方法第33-34页
   ·文本聚类评估第34-36页
第三章 文本预处理第36-45页
   ·文本表示第36-38页
     ·向量空间模型第36页
     ·特征项的权值计算第36-38页
   ·文本特征选择和抽取第38-39页
     ·文本预处理第38页
     ·文本特征选择和抽取第38-39页
   ·文档相似度计算方法第39-42页
     ·Set/Bag 模型第39-41页
     ·基于向量的相似度计算第41-42页
     ·广义向量空间模型(GVSM)第42页
   ·特征降维第42-43页
   ·去除重复文本第43-45页
第四章 文本聚类系统的设计与实现第45-55页
   ·系统整体结构第45-46页
     ·文档预处理第45页
     ·文档表示第45-46页
   ·文档聚类算法第46-49页
     ·簇表示第46-47页
     ·增量聚类算法第47-49页
   ·簇描述方法第49-50页
     ·概括方法第49页
     ·将测试样本理论应用于项集第49-50页
   ·实验和结果第50-54页
   ·结论第54-55页
第五章 总结与展望第55-56页
致谢第56-57页
参考文献第57-61页
附录:作者在攻读硕士学位期间发表的论文第61页

论文共61页,点击 下载论文
上一篇:基于着色Petri网的工作流建模与分析研究
下一篇:指纹识别相关算法研究