首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于边界距离的文本聚类方法研究

摘要第1-7页
Abstract第7-11页
第1章 前言第11-17页
   ·聚类分析概述第11-13页
   ·文本聚类第13-15页
     ·文本聚类的定义第13页
     ·文本聚类的主要应用第13-14页
     ·文本聚类的难点第14-15页
   ·本文的研究内容第15-16页
   ·全文的组织结构第16-17页
第2章 文本聚类过程第17-30页
   ·文本预处理第17-18页
   ·特征选取第18页
   ·文本表示第18-20页
     ·布尔模型第19-20页
     ·概率模型第20页
   ·相似度计算第20-23页
     ·相似性测度第20-21页
     ·常用的距离函数第21-22页
     ·相似系数函数第22-23页
   ·聚类算法概述第23-27页
     ·基于层次的方法(hierarchical method)第23-24页
     ·基于划分的方法(partition-based clustering)第24-26页
     ·基于密度的方法(density-based method)第26页
     ·基于网格的方法(grid-based method)第26-27页
     ·基于模型的方法(model-based method)第27页
     ·后缀树算法(Suffix Tree Clustering)第27页
     ·其他的聚类算法第27页
   ·聚类质量的评测第27-29页
     ·F-Measure第28页
     ·纯度第28页
     ·熵第28-29页
     ·整体相似度第29页
   ·小结第29-30页
第3章 基于边界距离的多向量文本聚类方法第30-45页
   ·多向量文本表示第30-32页
     ·传统向量空间模型第30-31页
     ·多向量文本表示第31-32页
   ·相似度定义第32-34页
   ·基于边界距离的层次聚类算法第34-35页
   ·实验语料第35-37页
   ·实验结果及分析第37-44页
     ·K 值的选取第37-39页
     ·层次聚类算法对比实验第39-40页
     ·特征选取与K 值的关系第40-41页
     ·层次聚类算法与渐增式K-Means 算法的对比第41-43页
     ·不同文本表示方法对比试验第43-44页
   ·小结第44-45页
第4章 基于知网的特征抽取方法第45-55页
   ·语义资源--知网第46-47页
   ·基于知网相关概念场的词义消歧第47-50页
   ·基于描述能力的义原抽取第50-51页
   ·实验语料第51页
   ·实验结果与分析第51-53页
   ·小结第53-55页
结论第55-56页
参考文献第56-59页
致谢第59-60页
攻读硕士期间发表(含录用)的学术论文第60页

论文共60页,点击 下载论文
上一篇:基于短语的对数线性模型的统计机器翻译方法与系统实现
下一篇:基于知网的汉语词义消歧方法的研究