首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于X~2统计的中文文本分类特征选择方法研究

摘要第1-6页
ABSTRACT第6-8页
第一章 绪论第8-14页
   ·研究背景和意义第8-9页
   ·国内外文本分类研究现状综述第9-12页
     ·文本分类介绍第9-10页
     ·特征选择介绍第10页
     ·国内外研究现状第10-12页
   ·本文的研究内容第12-14页
     ·本文的主要工作第12页
     ·本文的组织第12-14页
第二章 文本分类技术第14-29页
   ·文本分类的定义第14-15页
   ·文本分类任务流程第15-17页
   ·文本表示模型第17-18页
     ·向量空间模型第17页
     ·布尔模型第17-18页
     ·概率模型第18页
   ·常用的文本分类方法第18-26页
     ·Naive Bayes方法第19-20页
     ·KNN方法第20-21页
     ·类中心向量法第21-22页
     ·神经网络第22-24页
     ·支持向量机第24-25页
     ·决策树方法第25-26页
   ·文本分类方法的性能评估第26-28页
     ·查全率与查准率、宏平均与微平均第26-27页
     ·BEP(Break-even point)和F1(F-measure)第27-28页
   ·本章小结第28-29页
第三章 特征选择方法研究第29-33页
   ·特征选择方法概述第29-30页
   ·常用的特征选择方法及评价第30-32页
     ·文档频率(DF)第30-31页
     ·信息增益(IG)第31页
     ·互信息(MI)第31-32页
     ·X~2统计(CHI)第32页
   ·本章小结第32-33页
第四章 基于改进的X~2统计方法的特征选择第33-41页
   ·传统的X~2统计方法第33-34页
   ·应用举例第34-35页
   ·X~2统计方法的不足第35-36页
   ·改进的X~2统计方法第36-38页
     ·文档内频度第36页
     ·类内正确度第36-37页
     ·改进后X~2统计方法第37-38页
   ·中文文本分类系统第38-40页
     ·文本分类系统框架第38-39页
     ·特征选择系统第39-40页
     ·分类系统第40页
   ·本章小结第40-41页
第五章 实验与结果分析第41-48页
   ·数据来源及实验参数选择第41-42页
     ·数据来源第41页
     ·实验参数选择第41-42页
   ·文本分类实验结果分析第42-47页
     ·混淆矩阵第42-44页
     ·各个类的查全率、查准率、F1值第44页
     ·总体查全率、查准率、F1值第44-45页
     ·各个类的分类情况图形显示第45-47页
   ·本章小结第47-48页
第六章 总结与展望第48-50页
   ·本文的工作总结第48页
   ·进一步的工作第48-50页
参考文献第50-54页
致谢第54-55页
附录第55页

论文共55页,点击 下载论文
上一篇:一种基于Mealy机的BPEL程序验证模型研究
下一篇:基于蚁群算法的测试用例集约简技术研究