首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

中文文本分类中分词和特征选择方法研究

摘要第1-6页
Abstract第6-10页
第1章 绪论第10-14页
   ·研究背景及意义第10页
   ·文本分类的研究现状第10-12页
     ·国外的研究状况第10-11页
     ·国内的研究状况第11-12页
   ·本文研究工作第12-14页
第2章 中文文本分类基础第14-23页
   ·文本分类的定义第14页
   ·文本分类的过程第14-16页
   ·文本表示模型第16-18页
     ·向量空间模型第16-17页
     ·概率模型第17页
     ·布尔模型第17-18页
   ·支持向量机第18-22页
     ·最优超平面第18-19页
     ·线性可分情况第19-20页
     ·线性不可分情况第20-21页
     ·非线性情况第21-22页
   ·本章小结第22-23页
第3章 中文文本分词算法研究第23-34页
   ·中文文本字符串的预处理第23-24页
   ·基于词典分词算法的改进第24-30页
     ·基于词典分词算法第25页
     ·双向匹配存同消歧分词算法第25-30页
   ·实验结果与分析第30-33页
   ·本章小结第33-34页
第4章 特征选择方法研究第34-44页
   ·几种常用的特征选择方法第34-36页
     ·文档频率第34页
     ·信息增益第34-35页
     ·互信息第35-36页
   ·特征项权重的计算第36-37页
   ·TFIDF方法的分析与改进第37-41页
     ·TFIDF的不足第37-39页
     ·引入信息熵的改进TFIDF方法第39-41页
   ·实验结果与分析第41-43页
   ·本章小结第43-44页
第5章 中文文本分类原型系统的实现与分析第44-53页
   ·LIBSVM简介第44-46页
     ·LIBSVM的使用方法第44-45页
     ·训练与测试过程第45-46页
   ·评价标准第46-47页
   ·实验所用语料集第47-48页
   ·中文文本分类系统实验与分析第48-52页
   ·本章小结第52-53页
第6章 总结与展望第53-55页
   ·工作总结第53页
   ·进一步工作第53-55页
参考文献第55-58页
作者简介及在学期间所取得的科研成果第58-59页
致谢第59页

论文共59页,点击 下载论文
上一篇:基于Delaunay骨架模型的人体行为识别
下一篇:军队科技成果知识共享管理系统的设计与实现