首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于主题句矢量模型的文本聚类研究

摘要第1-6页
ABSTRACT第6-10页
第一章 绪论第10-14页
   ·本课题的研究背景和意义第10页
   ·国内外研究现状第10-11页
   ·本文的主要工作第11-12页
   ·论文的组织结构第12-14页
第二章 文本聚类的关键技术第14-26页
   ·文本聚类概述第14页
   ·文本预处理第14-15页
     ·自动分词第14-15页
     ·停用词过滤第15页
   ·文本特征提取第15-17页
     ·词频-逆文档频率法第15-16页
     ·互信息量法第16页
     ·X~2统计法第16页
     ·信息增益法第16-17页
   ·文本表示第17-18页
     ·布尔模型第17页
     ·向量空间模型第17-18页
     ·概率模型第18页
     ·其他模型第18页
   ·文本相似性度量第18-20页
     ·基于统计学的方法第18-19页
     ·基于语义分析的方法第19-20页
   ·文本聚类算法第20-24页
     ·划分方法第21-22页
     ·层次方法第22-24页
     ·基于密度的方法第24页
     ·基于网格的方法第24页
   ·本章小结第24-26页
第三章 基于主题句矢量模型的文本相似性度量第26-36页
   ·文本相似度研究面临的困难第26页
   ·基于主题句矢量模型的文本相似度算法第26-32页
     ·主题句矢量模型第27-28页
     ·主题句矢量模型的文本相似性计算第28页
     ·句子相似性计算第28-31页
     ·文本相似性算法描述第31-32页
   ·文本相似性度量实验第32-35页
     ·实验数据集第32页
     ·实验方案设计第32-33页
     ·实验结果分析第33-35页
   ·本章小结第35-36页
第四章 改进的k中心点算法研究第36-46页
   ·k中心点算法的局限性第36页
   ·参数k的确定第36-41页
     ·相似相异度函数第36-37页
     ·k值求解算法描述第37-38页
     ·k值求解实例第38-41页
   ·初始聚类中心的选择方法第41-44页
     ·初始聚类中心选择算法第41-42页
     ·初始聚类中心选择实验第42-44页
   ·改进的k中心点文本聚类算法第44-45页
   ·本章小结第45-46页
第五章 算法应用及结果分析第46-53页
   ·算法应用第46-49页
     ·开发环境第46页
     ·系统结构第46-49页
   ·实验结果评价第49-52页
     ·实验数据集第49页
     ·评价指标第49-50页
     ·实验结果分析第50-52页
   ·本章小结第52-53页
第六章 总结与展望第53-55页
   ·总结第53页
   ·展望第53-55页
参考文献第55-60页
致谢第60-61页
攻读硕士学位期间发表的论文第61页

论文共61页,点击 下载论文
上一篇:基于中间件的RFID系统安全研究
下一篇:基于多核并行的全文检索动态后继树模型相关算法研究