首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

一种基于eEPs的中文文本自动分类算法

摘要第1-5页
Abstract第5-7页
目录第7-9页
第一章 引言第9-12页
   ·研究背景第9页
   ·文本自动分类技术概述第9-10页
   ·本文工作和结构安排第10-12页
第二章 中文文本自动分类技术第12-21页
   ·中文文本自动分类的过程第12页
   ·特征提取第12-15页
     ·文档频率(Document Frequency,DF)第13-14页
     ·信息增益(Information Gain,IG)第14页
     ·互信息(Mutual information,MI)第14-15页
     ·开方拟和检验(x~2-test,CHI)第15页
   ·分类算法第15-19页
     ·Rocchio算法第15-16页
     ·朴素贝叶斯(Na(i|¨)ve Bayes,NB)第16-17页
     ·k最近邻居算法第17页
     ·支持向量机算法第17-18页
     ·决策树(Dtree,Decision Tree)算法第18-19页
     ·关于分类算法第19页
   ·对分类系统的评价第19-21页
第三章 EPs和eEPs的概念第21-36页
   ·EPs和eEPs的概念及特性第21-26页
     ·EPs的概念第21-23页
     ·EPs的特性及其常见形式第23-25页
     ·eEPs的特性第25-26页
   ·基于EPs和eEPs的分类算法第26-36页
     ·基于EPs的分类特点第27-28页
     ·基于EPs的分类算法第28-33页
     ·基于eEPs的分类算法第33-36页
第四章 基于eEP的文本分类算法TCEP第36-45页
   ·预处理过程第36-38页
   ·基于区分能力的特征提取方法第38-40页
   ·基于eEPs的中文文本分类算法TCEP第40-45页
     ·预处理及特征提取模块的实现第41-42页
     ·挖掘eEPs第42-43页
     ·对未知样本的分类第43-45页
第五章 算法TCEP的性能分析第45-52页
   ·实验数据第45-46页
   ·类个数阈值β对分类性能的影响第46-47页
   ·基于区分能力的特征提取方法和文档频率方法的比较第47-48页
   ·算法TCEP与其它算法的比较第48-52页
结束语第52-53页
致谢第53-54页
参考文献第54-58页
附录:硕士期间发表的学术论文第58页

论文共58页,点击 下载论文
上一篇:基于光谱吸收的CO2浓度检测系统的理论与实验研究
下一篇:富集纯化母血中胎儿有核红细胞并利用胎儿有核红细胞进行胎儿非整倍体的无创性产前诊断