首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

中文文本自动分类方法的研究和实现

中文摘要第1页
ABSTRACT第3-6页
第一章 引言第6-11页
   ·课题的目的和意义第6-7页
   ·文本自动分类系统的特点第7页
   ·拟定题目在国内外的发展第7-8页
     ·课题在国外的发展情况第7页
     ·课题在国内的发展情况第7-8页
   ·课题当前主要的应用领域第8页
   ·课题当前面临的突出问题第8-9页
   ·本文的主要工作第9-11页
第二章 文本分类基础理论及系统结构第11-29页
   ·文本分类基本概念第11-12页
     ·文本分类的定义第11页
     ·文本分类的类别第11-12页
   ·文本自动分类涉及的主要技术及方法第12-25页
     ·文本自动分词技术第12-13页
     ·文本表示技术第13-16页
     ·文本特征项的权重第16-17页
     ·文本的特征选择与特征提取第17-21页
     ·文本分类算法第21-25页
   ·文本分类的评价体系第25-27页
     ·查全率(Recall)与查准率(Precision)第25-26页
     ·宏平均(MacroAveraging)与微平均(MicroAveraging)第26-27页
     ·BEP(Breakevenpoint)和Fβ函数第27页
   ·文本分类的系统结构第27-28页
   ·本章小结第28-29页
第三章 中文文本自动分类系统的实现第29-48页
   ·中文文本自动分类系统的预处理第29-35页
     ·基于最大匹配分词算法的中文文本分词处理第29-31页
     ·改进的增强型最大匹配分词法(IMM法)第31-35页
     ·未登陆词识别第35页
   ·基于向量空间模型VSM的文本自动分类第35-36页
   ·基于KL-Divergence的特征选取算法第36-42页
     ·KL-Divergence定义第36-37页
     ·改进型KL-Divergence的特征选取法第37-39页
     ·特征权重的计算-TFIDF法第39-40页
     ·构建类模型第40-42页
   ·基于朴素贝叶斯算法的分类器构造第42-47页
     ·朴素贝叶斯分类器第42-44页
     ·改进的朴素贝叶斯分类器第44-47页
   ·本章小结第47-48页
第四章 系统设计与实验测试第48-54页
   ·系统设计框架第48页
   ·实验语料库及词典的构建第48-50页
     ·训练集和测试集第49页
     ·语料库的选取第49页
     ·词典的选取第49-50页
   ·实验环境第50页
   ·实验结果评价第50-53页
     ·分词系统实验结果第50-51页
     ·分类系统实验结果及评价第51-53页
   ·本章小结第53-54页
第五章 结论第54-56页
   ·总结第54-55页
   ·下一步工作展望第55-56页
参考文献第56-60页
致谢第60-61页
附录第61-64页
在学期间发表的学术论文和参加的科研情况第64页

论文共64页,点击 下载论文
上一篇:张祜诗集版本考辨
下一篇:毛细管电泳检测微量生物活性物质方法的建立及应用研究