首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

中文文本分类方法研究

摘要第1-4页
Abstract第4-11页
第1章 绪论第11-18页
   ·研究背景及意义第11-13页
     ·研究背景第11页
     ·研究意义第11-13页
   ·国内外研究现状第13-16页
     ·国外研究现状第13-15页
     ·国内研究现状第15-16页
   ·本文工作第16-18页
     ·本文的研究内容第16页
     ·本文的组织结构第16-18页
第2章 文本分类技术第18-36页
   ·文本分类概述第18-20页
     ·文本分类的定义第18页
     ·文本分类的发展过程第18-19页
     ·文本分类的基本流程第19-20页
   ·文本预处理第20-22页
     ·文本格式标记的处理第20页
     ·文本分词第20-21页
     ·去除停用词(stop words)和词干化(stemming)第21-22页
   ·文本表示模型第22-24页
     ·布尔模型第22页
     ·概率模型第22-23页
     ·向量空间模型第23-24页
   ·特征选择方法第24-27页
     ·文档频率第24-25页
     ·信息增益第25页
     ·互信息第25-26页
     ·χ~2统计第26-27页
   ·常用文本分类算法第27-35页
     ·决策树(Decision Tree)算法第27-28页
     ·K近邻(K-Nearest Neighbor)算法第28页
     ·Rocchio算法第28-29页
     ·朴素贝叶斯(Naive Bayes)算法第29-30页
     ·支持向量机(Support Vector Machine)算法第30-35页
   ·本章小结第35-36页
第3章 基于编码的向量空间模型第36-45页
   ·常用的文本特征权重表示方法第36-39页
     ·布尔权重(Binary Feature)第36-37页
     ·词频(Term Frequency)第37页
     ·IDF(Inverse Document Frequency)第37-38页
     ·TFIDF权重第38-39页
   ·基于编码的文本预处理方法第39-44页
     ·Base64编码第39-41页
     ·N-gram分词方法第41-43页
     ·构建向量空间模型第43-44页
   ·本章小结第44-45页
第4章 基于编码的中文文本分类方法第45-52页
   ·传统的中文文本分类方法第45-48页
     ·系统框架第45-46页
     ·分词模块第46-48页
   ·基于编码的中文文本分类方法第48-51页
     ·系统框架第48-49页
     ·预处理模块第49-50页
     ·特征选择模块第50-51页
     ·分类模块第51页
   ·本章小结第51-52页
第5章 实验结果与比较第52-62页
   ·评测指标第52-53页
   ·实验数据第53-54页
   ·实验结果第54-61页
     ·基于Base64编码的文本分类效果第55-59页
     ·与中文分词器方法的比较第59-61页
   ·本章小结第61-62页
第6章 总结和展望第62-64页
   ·总结第62-63页
   ·展望第63-64页
参考文献第64-69页
攻读硕士学位期间主要的研究成果第69-71页
致谢第71页

论文共71页,点击 下载论文
上一篇:基于最大后验概率与子空间学习的二维人脸变换
下一篇:基于无线网络的移动远程医疗监护系统的研究与实现