首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--软件工程论文

基于关联的中文文本分类系统的设计与实现

目录第1-7页
摘要第7-8页
ABSTRACT第8-10页
第一章 引言第10-19页
   ·文本自动分类的发展及应用第10-11页
     ·文本自动分类的提出第10页
     ·文本自动分类的发展与应用第10-11页
   ·文本分类及其相关技术理论第11-13页
     ·文本分类需要解决的问题第11-12页
     ·文本自动分类的关键技术第12-13页
   ·文本分类目前存在的问题第13-16页
     ·分词技术面临的难题第14-15页
     ·特征抽取过程中存在的问题第15-16页
     ·分类器存在的问题第16页
   ·本论文的主要工作及创新点第16-18页
     ·本论文的主要工作第16-17页
     ·本论文的创新点第17-18页
   ·论文组织第18-19页
第二章 中文文本自动分类模型体系第19-30页
   ·中文文本分类的体系框架第19-20页
   ·中文自动分词的主要理论技术第20-23页
     ·基于字符串匹配的分词方法第21-22页
     ·基于理解的分词方法第22页
     ·基于统计的分词方法第22-23页
     ·几种典型的自动分词系统第23页
   ·特征提取算法的主要理论技术第23-25页
     ·信息增益第24-25页
     ·互信息第25页
     ·X~2估计第25页
   ·文本分类器的主要理论技术第25-29页
     ·支持向量机法第26-27页
     ·K-近邻法第27-28页
     ·贝叶斯分类方法第28-29页
     ·其它分类器第29页
   ·本章小结第29-30页
第三章 基于关联的中文文本自动分类关键算法研究第30-60页
   ·基于HASH函数的高效中文自动分词算法第30-31页
     ·词表的建立第30页
     ·算法思想第30-31页
     ·歧义识别第31页
   ·基于关联分组最优树文本特征抽取方法第31-44页
     ·词级关联分组结构图第32-33页
     ·WordNet词表的实现第33-39页
       ·WordNet的概述第33-34页
       ·WordNet的设计思想第34-37页
       ·中文WordNet的实现第37-39页
       ·WordNet的评价第39页
     ·基于关联分组最优树的建立第39-43页
       ·词级关联分组的生成第39-40页
       ·最优树的生成第40-41页
       ·特征矩阵的建立第41-42页
       ·综合评价第42-43页
     ·实验与结果第43-44页
   ·贝叶斯分类器第44-59页
     ·贝叶斯判别标准第44-46页
     ·贝叶斯判别效果和判别能力的检验第46-51页
       ·均值向量和协方差矩阵的估计值第46-48页
       ·两个文本样本之间差异的显著性检验第48-49页
       ·多个文本样本判别效果的检验第49-50页
       ·各变量的相对判别能力第50-51页
     ·贝叶斯分类过程第51-55页
       ·逐步选入变量第52-53页
       ·及时剔除变量第53-54页
       ·判别分类第54-55页
     ·实验与结果第55-59页
   ·本章小结第59-60页
第四章 基于关联的分类系统的实现与性能分析第60-70页
   ·分类系统的实现第60-64页
     ·分类系统的训练第60-64页
     ·分类系统中分类器的实现第64页
   ·分类系统的性能比较分析第64-69页
     ·实验与结果第65-68页
     ·系统性能分析第68-69页
   ·本章小结第69-70页
第五章 结束语第70-72页
   ·工作总结第70-71页
   ·有待进一步研究的工作第71-72页
致谢第72-73页
参考文献第73-77页
附研究生在读研期间的科研经历第77页

论文共77页,点击 下载论文
上一篇:电子政务环境下中国城市管理体制改革研究
下一篇:黑龙江省城镇化问题研究