首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

中文文本分类中的关键技术研究

摘要第1-6页
Abstract第6-9页
第一章 绪论第9-14页
   ·选题背景和意义第9-10页
   ·国内外研究现状第10-12页
     ·国外研究现状第10-11页
     ·国内研究现状第11-12页
   ·本文所做的主要工作第12页
   ·本文的组织结构第12-14页
第二章 文本分类过程及相关技术概述第14-23页
   ·文本分类的一般过程第14-15页
   ·文本预处理第15-17页
     ·中文分词第16-17页
     ·停用词处理第17页
   ·文本表示第17-19页
     ·布尔模型第17-18页
     ·向量空间模型第18-19页
     ·概率模型第19页
   ·特征选择第19-20页
   ·文本分类算法概述第20-21页
   ·文本分类性能评价第21-23页
第三章 特征选择函数及权重计算方法第23-32页
   ·特征选择函数第23-27页
     ·特征频度第23页
     ·文档频率第23-24页
     ·信息增益第24-25页
     ·互信息第25页
     ·χ~2统计第25页
     ·期望交叉熵第25-26页
     ·特征选择函数的评价方法第26-27页
   ·特征项权值计算方法第27-28页
     ·布尔权重第27页
     ·TFIDF权重第27-28页
   ·TFIDF-BCBT权重计算方法第28-32页
第四章 文本分类算法第32-43页
   ·朴素贝叶斯算法第32-33页
   ·KNN(K近邻)分类算法第33-35页
   ·支持向量机第35-36页
   ·人工神经网络算法第36-37页
   ·决策树算法第37-39页
   ·基于训练样本集剪裁的RKNN文本分类算法第39-43页
     ·传统KNN算法的优缺点第39-41页
     ·RKNN文本分类算法描述第41-42页
     ·RKNN文本分类算法计算量分析第42-43页
第五章 实验与分析第43-52页
   ·特征选择算法对文本分类性能的影响第43-45页
   ·TFIDF与TFIDF-BCBT对比实验第45-47页
   ·特征维数对文本分类性能的影响第47-48页
   ·K的取值对文本分类性能的影响第48-49页
   ·KNN和RKNN文本分类算法对比实验第49-52页
第六章 总结与展望第52-53页
   ·总结第52页
   ·未来研究工作展望第52-53页
参考文献第53-58页
致谢第58页

论文共58页,点击 下载论文
上一篇:基于视频的交通参数采集算法研究
下一篇:J2EE技术在统计信息系统安全体系中应用与研究