首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于X~2统计的中文文本分类特征选择方法研究

 摘要第1-6页
ABSTRACT第6-10页
1 绪论第10-16页
   ·问题的提出及研究意义第10-12页
     ·问题的提出第10-11页
     ·研究意义第11-12页
   ·国内外研究现状第12-14页
   ·本文的研究内容第14-16页
     ·本文的主要工作第14页
     ·本文的组织第14-16页
2 文本分类技术第16-32页
   ·引言第16页
   ·文本分类问题描述第16-18页
   ·文本的形式化第18页
   ·常用的文本特征选择方法第18-20页
     ·特征词的文档频率(DF)第19页
     ·信息增益方法(IG)第19页
     ·互信息方法(MI)第19-20页
     ·χ~2 统计量(CHI)第20页
   ·特征词的权重计算第20-21页
   ·常用的文本分类方法第21-28页
     ·Naive Bayes 方法第22-23页
     ·KNN 方法第23页
     ·类中心向量法第23-24页
     ·神经网络第24-26页
     ·支持向量机第26-27页
     ·决策树方法第27-28页
   ·文本分类方法的性能评估第28-30页
     ·查全率与查对率、宏平均与微平均第28-29页
     ·BEP(Break-even point)和F1(F-measure)第29-30页
   ·本章小结第30-32页
3 基于χ~2 统计的特征选择方法第32-36页
   ·χ~2统计方法的不足第32-33页
   ·χ~2统计方法的改进第33-35页
     ·频度第33-34页
     ·类间集中度第34页
     ·类内分散度第34-35页
   ·本章小结第35-36页
4 实验方法与结果分析第36-48页
   ·中文文本分类系统构造第36-39页
     ·中文文本分类系统结构第36-37页
     ·分词系统第37-38页
     ·特征选择系统第38-39页
     ·分类系统第39页
     ·本节小结第39页
   ·数据来源第39-40页
   ·特征选择个数的选取第40页
   ·文本分类实验第40-46页
     ·混淆矩阵第40-43页
     ·总体查全率、查对率、F_1 值第43页
     ·各个类的查全率、查对率、F_1 值第43-44页
     ·各个类的分类情况图形显示第44-46页
     ·本节小结第46页
   ·本章小结第46-48页
5 结论与展望第48-50页
   ·本文的工作总结第48页
   ·进一步的工作第48-50页
致谢第50-51页
参考文献第51-54页
附录第54-56页

论文共56页,点击 下载论文
上一篇:Ad-p53逆转乳腺癌耐药性及其对P-gp、TOPOⅡ和GST-π表达的影响
下一篇:论东北亚安全共有观念的构建