首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

结合权重因子与特征向量的文本聚类研究与应用

摘要第1-5页
Abstract第5-10页
第一章 绪论第10-15页
   ·课题研究的背景及意义第10-11页
   ·研究现状与困难第11-13页
     ·国内外研究现状第11页
     ·面临的困难第11-13页
   ·本论文的主要工作和结构安排第13-15页
     ·本论文的主要研究内容第13页
     ·文章的结构安排第13-15页
第二章 文本聚类相关技术概述第15-25页
   ·文本预处理第15-18页
     ·文本分词技术第16-17页
     ·去除停用词和低频词第17-18页
     ·同义词的并归第18页
   ·文本特征选择第18-20页
     ·特征选择方法第18-20页
   ·降维处理第20页
   ·文本聚类方法第20-21页
   ·聚类统计量和评估第21-23页
     ·统计量第21-22页
     ·聚类评估第22-23页
   ·聚类评价函数第23-24页
     ·F1-measue指标第23-24页
     ·平均准确率第24页
   ·小结第24-25页
第三章 结合权重因子与特征向量改进的文本预处理方法第25-35页
   ·文本的表示方法第25-26页
   ·特征词权重的计算方法第26-27页
   ·文本相似度计算方法第27-28页
   ·改进的文本预处理方法第28-30页
     ·通过权重因子改进TF-IDF算法第28页
     ·根据特征向量修改表示方法第28-29页
     ·重构余弦相似度计算方法第29页
     ·聚类步骤及流程图第29-30页
   ·实验分析第30-34页
     ·特征词选取和测试环境第30-31页
     ·测试标准第31页
     ·实验过程第31-32页
     ·实验结果分析第32-34页
   ·小结第34-35页
第四章 遗传控制因子改进的遗传K均值文本聚类算法第35-51页
   ·遗传K-均值第35-38页
     ·K-均值第35-36页
     ·遗传算法第36-37页
     ·遗传K-均值算法第37-38页
   ·GGKM文本聚类算法第38-45页
     ·遗传控制因子(GCF)第39-40页
     ·适应度函数设计第40页
     ·GGKM算法算子操作第40-42页
     ·准则函数设计与终止条件第42-43页
     ·GGKM步骤及流程图第43-45页
   ·文本聚类方法实验第45-50页
     ·实验设计第45页
     ·评价标准和参数设置第45-46页
     ·降维处理第46页
     ·实验步骤与结果分析第46-50页
   ·小结第50-51页
第五章GGKM在舆情热点发现的应用第51-55页
   ·舆情热点发现第51-52页
     ·舆情分析步骤第51页
     ·舆情热点发现与流程图第51-52页
   ·实验分析第52-54页
     ·实验介绍第52-53页
     ·结果分析第53-54页
   ·小结第54-55页
第六章 结论与展望第55-56页
参考文献第56-59页
致谢第59-60页
攻读学位期间的研究成果第60-61页

论文共61页,点击 下载论文
上一篇:基于DCT域的多重视频水印算法研究
下一篇:基于VGI的旅游信息挖掘与推荐关键技术研究