首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

维吾尔语文本聚类算法研究

摘要第1-4页
ABSTRACT第4-7页
第一章 绪论第7-10页
   ·研究背景第7页
   ·课题研究的理论和意义第7-8页
   ·国内外研究现状第8-9页
   ·主要研究内容及安排第9-10页
第二章 文本聚类的相关知识第10-26页
   ·文本聚类概述第10-11页
     ·文本聚类的概念第10页
     ·文本聚类的过程第10-11页
   ·文本预处理第11-12页
   ·特征提取第12-14页
   ·文本特征表示第14-18页
     ·向量空间模型第14-16页
     ·语言模型第16-17页
     ·布尔模型第17页
     ·概率模型第17-18页
   ·相似度计算方法第18-22页
     ·文本之间的相似度计算第19-20页
     ·文本集合之间的相似度计算第20-22页
     ·文本与集合之间的相似度计算第22页
   ·文本聚类算法第22-26页
     ·基于划分的方法第23-24页
     ·基于层次的方法第24页
     ·基于密度的方法第24-25页
     ·基于网格的方法第25页
     ·基于模型的方法第25-26页
第三章 改进后缀树维吾尔语文本聚类第26-36页
   ·改进后缀树聚类算法第27-31页
     ·相关概念介绍第27-28页
     ·文本信息预处理第28页
     ·构造后缀树第28页
     ·改进的基类选取第28-31页
     ·基类的合并第31页
   ·实验结果与分析第31-34页
     ·实验的数据集第31-32页
     ·评价指标第32页
     ·实验结果与分析第32-34页
   ·本章小结第34-36页
第四章 词集合作为特征的维吾尔语文本聚类第36-53页
   ·向量空间模型的相关工作第36-38页
   ·TCWS 算法第38-45页
     ·TCWS 的理论第38-41页
     ·TCWS 的具体过程第41-45页
   ·实验设计第45-47页
     ·实验语料第45-46页
     ·评价指标第46页
     ·设计实验第46-47页
   ·实验结果及分析第47-51页
     ·聚类算法选择实验第47-48页
     ·参数的选取第48页
     ·确定建立相关词集合的阈值第48-49页
     ·TCWS 的对比实验第49-51页
   ·本章小结第51-53页
第五章 总结与展望第53-54页
   ·总结第53页
   ·展望第53-54页
参考文献第54-59页
硕士研究生期间所发表的论文第59-60页
致谢第60页

论文共60页,点击 下载论文
上一篇:基于Hadoop的分布式Web文本检索系统的研究与开发
下一篇:哈萨克文手机输入法的设计与实现