首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于相似度的文本聚类算法研究及应用

摘要第1-6页
ABSTRACT第6-11页
第一章 绪论第11-17页
   ·研究背景及意义第11-12页
   ·文本聚类的研究现状第12-15页
     ·文本聚类简介第13-14页
     ·文本聚类存在的问题第14-15页
   ·研究内容及安排第15-17页
第二章 中文文本聚类算法及分析第17-34页
   ·文本预处理第17-26页
     ·分词第17-19页
     ·停用词过滤第19-21页
     ·特征选择第21-25页
     ·文本特征表示第25-26页
   ·文本聚类算法第26-31页
     ·划分聚类算法第27-28页
     ·层次聚类算法第28-29页
     ·基于密度的聚类算法第29-30页
     ·基于网格的聚类算法第30页
     ·基于模型的聚类算法第30-31页
     ·基于模糊的聚类算法第31页
   ·文本聚类效果评价指标第31-33页
   ·本章小结第33-34页
第三章 基于语义列表的中文文本聚类算法第34-47页
   ·传统的文本表示模型第35-38页
     ·向量空间表示模型第35-36页
     ·布尔表示模型第36-37页
     ·概率表示模型第37页
     ·其它模型第37-38页
   ·语义列表第38-39页
     ·语义列表表示法第38-39页
     ·聚簇的语义列表表示法第39页
   ·相似度计算第39-41页
     ·词之间相似度的计算第39-40页
     ·文本之间相似度的计算第40-41页
   ·基于语义列表的中文文本聚类算法第41-43页
     ·算法描述第41-43页
     ·聚簇描述第43页
   ·实验及分析第43-46页
     ·实验步骤第44-45页
     ·聚类正确率对比第45-46页
   ·本章小结第46-47页
第四章 一种阈值优化的文本密度聚类算法第47-56页
   ·DBSCAN算法第47-49页
     ·算法思想第47-48页
     ·算法流程第48页
     ·DBSCAN算法面临的主要问题第48-49页
   ·阈值优化的文本密度聚类算法第49-52页
     ·定义和阈值的选择第49-52页
     ·OTDBTC算法第52页
   ·实验及分析第52-54页
     ·聚类运行时间对比第52-53页
     ·查全率和查准率对比第53-54页
   ·本章小结第54-56页
第五章 系统设计与实验结果评价分析第56-64页
   ·文本聚类系统的设计第56页
   ·系统功能模块分析第56-60页
   ·实验数据测试集及结果评价方法第60页
     ·实验所用数据测试集第60页
     ·聚类结果的评价方法第60页
   ·文本聚类系统的实现第60-63页
     ·系统开发环境第61页
     ·系统功能界面第61-63页
   ·本章小结第63-64页
第六章 总结与展望第64-66页
   ·总结第64页
   ·展望第64-66页
参考文献第66-71页
致谢第71-72页
攻读硕士学位期间发表的学术论文第72页

论文共72页,点击 下载论文
上一篇:基于多关系分类聚类的学习适应性诊断
下一篇:基于小波变换特征的医学图像分类研究