首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

文本分类相关技术与应用研究

摘要第1-4页
ABSTRACT第4-5页
目录第5-7页
第1章 绪论第7-11页
   ·选题的目的和意义第7-8页
   ·国内外研究现状第8-10页
   ·本文研究工作第10页
   ·本文组织结构第10-11页
第2章 文本分类理论基础第11-27页
   ·文本分类基本概念第11-13页
     ·文本分类的定义第11-12页
     ·文本分类的类别第12-13页
   ·文本表示第13-18页
     ·向量空间模型(VSM)第13页
     ·文本特征词的表示第13-16页
       ·停用词对文本分类的影响第14页
       ·特征词的权重第14-16页
     ·特征选择第16-18页
       ·文档频率第16-17页
       ·信息增益第17页
       ·互信息第17-18页
       ·X~2统计第18页
   ·文本分类方法介绍第18-22页
     ·贝叶斯方法第19-20页
     ·最近K邻居方法第20页
     ·中心向量比较算法(Rocchio)第20-21页
     ·支持向量机法第21页
     ·决策树分类法第21-22页
   ·文本分类的评价体系第22-25页
     ·查全率(Recall)与查准率(Precision)第22-24页
     ·宏平均(Macro Averaging)与微平均(Micro Averaging)第24页
     ·BEP(Breakeven point)和F_β函数第24-25页
   ·文本分类的系统结构第25-26页
   ·本章小结第26-27页
第3章 文本分类系统的实现第27-50页
   ·文本分类系统的预处理第27-35页
     ·基于最大匹配分词算法的中文文本分词处理第27-30页
       ·最大匹配分词法(Maximum Matching method,MM法)第28-29页
       ·歧义词处理第29-30页
     ·改进的增强型最大匹配分词法(IMM法)第30-34页
     ·未登陆词识别第34-35页
   ·基于向量空间模型VSM的文本分类第35页
   ·基于KL—Divergence的特征选取算法第35-43页
     ·KL—Divergence定义第36-37页
     ·改进型KL-Divergence的特征选取法第37-39页
     ·特征权重的计算—TFIDF法第39-41页
     ·构建类模型第41-43页
   ·基于朴素贝叶斯算法的分类器构造第43-49页
     ·朴素贝叶斯分类器第43-45页
     ·改进的朴素贝叶斯分类器第45-49页
   ·本章小结第49-50页
第4章 实验结果及分析第50-56页
   ·系统设计框架第50页
   ·实验语料库及词典的构建第50-52页
     ·训练集和测试集第51页
     ·语料库的选取第51页
     ·词典的选取第51-52页
   ·实验结果评价第52-55页
     ·分词系统实验结果第52-53页
     ·分类系统实验结果及评价第53-55页
   ·本章小结第55-56页
第5章 总结与展望第56-57页
   ·工作总结第56页
   ·下一步工作展望第56-57页
参考文献第57-61页

论文共61页,点击 下载论文
上一篇:玉米幼芽提取物对果蝇和小鼠睾丸抗衰老作用的实验研究
下一篇:基于DSP的三相PWM AC/DC变换技术的研究