基于主题句矢量模型的文本聚类研究

摘要	第1-6页
ABSTRACT	第6-10页
第一章绪论	第10-14页
·本课题的研究背景和意义	第10页
·国内外研究现状	第10-11页
·本文的主要工作	第11-12页
·论文的组织结构	第12-14页
第二章文本聚类的关键技术	第14-26页
·文本聚类概述	第14页
·文本预处理	第14-15页
·自动分词	第14-15页
·停用词过滤	第15页
·文本特征提取	第15-17页
·词频-逆文档频率法	第15-16页
·互信息量法	第16页
·X~2统计法	第16页
·信息增益法	第16-17页
·文本表示	第17-18页
·布尔模型	第17页
·向量空间模型	第17-18页
·概率模型	第18页
·其他模型	第18页
·文本相似性度量	第18-20页
·基于统计学的方法	第18-19页
·基于语义分析的方法	第19-20页
·文本聚类算法	第20-24页
·划分方法	第21-22页
·层次方法	第22-24页
·基于密度的方法	第24页
·基于网格的方法	第24页
·本章小结	第24-26页
第三章基于主题句矢量模型的文本相似性度量	第26-36页
·文本相似度研究面临的困难	第26页
·基于主题句矢量模型的文本相似度算法	第26-32页
·主题句矢量模型	第27-28页
·主题句矢量模型的文本相似性计算	第28页
·句子相似性计算	第28-31页
·文本相似性算法描述	第31-32页
·文本相似性度量实验	第32-35页
·实验数据集	第32页
·实验方案设计	第32-33页
·实验结果分析	第33-35页
·本章小结	第35-36页
第四章改进的k中心点算法研究	第36-46页
·k中心点算法的局限性	第36页
·参数k的确定	第36-41页
·相似相异度函数	第36-37页
·k值求解算法描述	第37-38页
·k值求解实例	第38-41页
·初始聚类中心的选择方法	第41-44页
·初始聚类中心选择算法	第41-42页
·初始聚类中心选择实验	第42-44页
·改进的k中心点文本聚类算法	第44-45页
·本章小结	第45-46页
第五章算法应用及结果分析	第46-53页
·算法应用	第46-49页
·开发环境	第46页
·系统结构	第46-49页
·实验结果评价	第49-52页
·实验数据集	第49页
·评价指标	第49-50页
·实验结果分析	第50-52页
·本章小结	第52-53页
第六章总结与展望	第53-55页
·总结	第53页
·展望	第53-55页
参考文献	第55-60页
致谢	第60-61页
攻读硕士学位期间发表的论文	第61页