首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

中文文本分类算法比较研究

摘要第1-6页
Abstract第6-9页
第1章 绪论第9-14页
   ·研究背景及意义第9-10页
   ·研究现状第10-12页
     ·国外研究现状第10页
     ·国内研究现状第10-11页
     ·当前主要应用领域第11页
     ·当前研究重点问题第11-12页
   ·本文的主要研究工作第12页
   ·本文的组织第12-14页
第2章 中文文本分类技术第14-30页
   ·文本分类的定义第14页
   ·文本分类的类别第14-16页
   ·文本预处理第16-20页
     ·中文分词第16-19页
     ·中文词性标注第19-20页
   ·文本表示第20-22页
     ·布尔模型第21页
     ·向量空间模型第21-22页
     ·概率模型第22页
   ·特征选取第22-25页
     ·文本频率第23页
     ·互信息第23-24页
     ·信息增益第24页
     ·x~2统计第24-25页
   ·权重计算第25-26页
   ·文本分类方法第26-29页
     ·贝叶斯方法第26-27页
     ·k-近邻方法第27-28页
     ·支持向量机方法第28-29页
   ·分类算法评估第29页
   ·本章小结第29-30页
第3章 基于类别核心词上下文矩阵的文本表示方法第30-38页
   ·向量空间模型(VSM)的优缺点第30页
   ·上下文词语之间的关系描述第30-33页
     ·核心词上下文矩阵第32页
     ·词语上下文信息量描述第32-33页
   ·基于类别核心词上下文矩阵的文本表示方法KTFIDF第33-37页
     ·类别核心词的确定第34页
     ·类别核心词上下文矩阵第34-35页
     ·类别核心词上下文矩阵的加权方法第35-36页
     ·基于类别核心词的上下文矩阵的文本表示方法KTFIDF第36-37页
   ·本章小结第37-38页
第4章 中文文本分类方法的比较第38-43页
   ·三种分类方法理论比较第38-39页
     ·贝叶斯方法(NB)的优缺点第38页
     ·最近邻方法(KNN)的优缺点第38页
     ·支持向量机方法(SVM)的优缺点第38-39页
   ·实验结果及分析第39-42页
     ·实验环境及实验数据第39页
     ·实验结果第39-42页
   ·本章小结第42-43页
第5章 结论与展望第43-45页
   ·结论第43页
   ·展望第43-45页
参考文献第45-48页
攻读硕士期间发表论文情况第48-49页
致谢第49-50页

论文共50页,点击 下载论文
上一篇:利用高斯生成数据对聚类算法的比较
下一篇:视觉文档图像的几何校正