首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于文本相似度的中文文本聚类的研究

摘要第1页
Abstract第3-7页
第一章 绪论第7-10页
   ·研究背景和意义第7页
   ·本文工作第7-8页
   ·论文组织第8-10页
第二章 中文自动分词第10-22页
   ·引言第10-11页
   ·中文未登录词的识别第11-18页
     ·未登录词的研究现状第11-12页
     ·基于统计的中文姓名识别第12-17页
     ·实验结果及分析第17-18页
   ·歧义消解第18-21页
     ·歧义产生的根源第18-19页
     ·歧义的类型第19-21页
       ·交集型歧义消解第20页
       ·多义组合型歧义消解第20-21页
   ·本章小结第21-22页
第三章 降维技术相关研究第22-37页
   ·文档表示第22-23页
   ·特征项类别选择第23-24页
     ·字特征第23页
     ·词特征第23-24页
     ·n-gram特征第24页
   ·特征选择主要方法的分析选择第24-28页
     ·信息增益(IG)第24-25页
     ·x~2统计(CHI)第25-26页
     ·互信息(MI)第26页
     ·文档频率(DF)第26-27页
     ·特征增强(TS)第27页
     ·基于熵的特征排序(En)第27-28页
     ·特征贡献(TC)第28页
   ·常用特征选择方法在中文文本聚类中的应用实验研究第28-31页
   ·特征抽取比较分析第31-36页
     ·主成分分析法(PCA)第31-32页
     ·隐含语义标引(LSI)第32-33页
     ·多维标度法(MDS)第33-34页
     ·局部线性嵌入(LLE)第34-36页
     ·词聚类第36页
   ·本章小结第36-37页
第四章 中文文本相似度计算第37-41页
   ·引言第37页
   ·向量空间模型第37页
   ·中文文本相似度计算的主要方法第37-39页
     ·基于VSM的TF-IDF算法第38页
     ·改进的TF-IDF算法第38-39页
   ·相似度计算第39页
   ·实验结果及分析第39-40页
   ·本章小结第40-41页
第五章 基于VSM的文本聚类第41-52页
   ·主要文本聚类算法比较第41-45页
     ·层次聚类算法第41-42页
     ·划分聚类算法第42-43页
     ·基于密度的聚类算法第43页
     ·基于网格的聚类算法第43-44页
     ·基于模型的聚类算法第44页
     ·模糊聚类算法第44-45页
   ·聚类效果评定第45-46页
   ·实验设计及结果分析第46-51页
     ·研究资源第46-47页
     ·总体设计第47页
     ·组织聚类第47-50页
       ·文本预处理第47-48页
       ·相似度计算第48-49页
       ·基于编网法的模糊文本聚类第49-50页
     ·实验结果及其分析第50-51页
   ·本章小结第51-52页
第六章 文本聚类在多文档自动文摘中应用第52-63页
   ·引言第52-53页
   ·关键技术第53-58页
     ·句子相似度第53-57页
       ·基于词权重的相似度计算第54-55页
       ·基于潜在语义分析的句子相似度计算第55页
       ·基于词义距离的句子相似度计算第55-56页
       ·基于语义依存的句子相似度计算第56-57页
     ·文摘句抽取第57页
     ·文摘句排序第57-58页
   ·评价技术第58-59页
   ·实现过程及效果分析第59-62页
     ·多文档自动文摘的实现第59-61页
     ·实验结果及分析第61-62页
   ·本章小结第62-63页
第七章 总结与展望第63-65页
   ·本文总结第63页
   ·进一步的工作第63-65页
参考文献第65-70页
致谢第70-71页
在学期间发表的学术论文和参加科研情况第71页

论文共71页,点击 下载论文
上一篇:移动终端数据引擎软件的设计与实现
下一篇:基于工单的呼叫中心系统的研究及其应用