首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--一般性问题论文--理论、方法论文--算法理论论文

基于相似度的文本聚类算法研究及应用

摘要第1-6页
ABSTRACT第6-10页
第一章 绪论第10-14页
   ·课题研究背景及意义第10-11页
   ·国内外研究现状第11-12页
   ·研究内容及安排第12-14页
第二章 文本聚类算法及分析第14-27页
   ·文本挖掘相关知识第14-18页
     ·文本挖掘的定义第14页
     ·文本挖掘的处理过程第14-15页
     ·文本挖掘的特点第15-16页
     ·文本挖掘常用技术第16页
     ·文本挖掘中面临的课题第16-18页
   ·文本聚类算法第18-22页
     ·基于划分的算法第18页
     ·基于层次的算法第18-19页
     ·基于密度的算法第19-20页
     ·基于网格的算法第20-21页
     ·基于模型的算法第21-22页
     ·基于模糊的算法第22页
   ·文本聚类算法的比较第22-24页
   ·文本聚类效果评价指标第24-26页
   ·本章小结第26-27页
第三章 基于单词相似度的文本聚类算法第27-50页
   ·文本预处理第27-40页
     ·分词第27-31页
     ·停用词第31-32页
     ·特征选择第32-37页
     ·文本表示模型第37-40页
   ·基于单词类的向量空间模型第40-43页
     ·单词相似度第41-42页
     ·单词类权重计算第42-43页
   ·基于单词相似度的文本聚类算法第43-49页
     ·文本相似度第43-46页
     ·算法流程第46-47页
     ·实验结果及分析第47-49页
   ·本章小结第49-50页
第四章 基于文本平均相似度的K-Means算法第50-66页
   ·K-Means算法的研究第50-55页
     ·K-Means算法介绍第50-52页
     ·K-Means算法的特点第52页
     ·K-Means算法存在的问题第52-55页
   ·K-Means对初始聚类中心的依赖性分析及现有改进第55-60页
     ·依赖性分析第55-57页
     ·选择初值的现有方法第57-60页
   ·基于文本平均相似度的K-Means算法第60-65页
     ·算法思想第61-62页
     ·算法流程第62-63页
     ·实验结果及分析第63-65页
   ·本章小结第65-66页
第五章 文本聚类在公安情报系统中的应用第66-76页
   ·公安情报系统简介第66-68页
   ·舆情采集及处理第68-70页
     ·舆情采集第69页
     ·舆情处理第69-70页
   ·文本聚类子系统第70-75页
     ·文本聚类子系统的设计第70-72页
     ·文本聚类子系统的实现第72-75页
   ·本章小结第75-76页
第六章 总结与展望第76-78页
   ·总结第76-77页
   ·展望第77-78页
参考文献第78-82页
致谢第82-83页
攻读硕士学位期间发表的学术论文第83页

论文共83页,点击 下载论文
上一篇:非物质音乐文化遗产面临的危机和应对措施--以学校“乡土音乐教育”为例
下一篇:国民形象的建构和争夺--以“《不怕死》事件”为中心的考察