首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

快速文本分类研究

摘要第1-4页
ABSTRACT第4-7页
第一章 引言第7-12页
   ·研究背景第7页
   ·研究意义第7-8页
   ·研究历史第8-9页
   ·研究现状第9-11页
     ·特征选择与压缩第9页
     ·分类器组合第9-10页
     ·小样本问题第10页
     ·层次文本分类第10页
     ·样本不均衡问题第10-11页
   ·研究内容第11-12页
第二章 文本分类方法概述第12-22页
   ·文本的表示第12-14页
     ·文本向量的表示方法第12-13页
     ·文本向量的特征权重表示方法第13-14页
   ·分词方法第14-15页
     ·基于字符串匹配的分词方法第14页
     ·基于统计的分词方法第14页
     ·专家系统分词方法第14-15页
     ·神经网络的分词方法第15页
   ·特征选择第15-17页
     ·词频方法第15页
     ·信息增益方法第15-16页
     ·互信息方法第16页
     ·交叉熵方法第16页
     ·文本证据权方法第16页
     ·CHI 统计方法第16-17页
     ·几率比方法第17页
   ·分类方法第17-20页
     ·贝叶斯方法第17-18页
     ·k 近邻方法第18页
     ·决策树方法第18页
     ·支持向量机方法第18页
     ·神经网络方法第18-19页
     ·基于投票的方法第19页
     ·Rocchio 方法第19页
     ·Sleeping Expert 方法第19-20页
   ·分类算法评估指标第20-22页
     ·召回率与精确率第20页
     ·BEP 与F-Measure第20-21页
     ·微平均与宏平均第21-22页
第三章 快速文本分类技术第22-33页
   ·降维技术第22-27页
     ·类别可分离性判据第22-23页
     ·特征提取第23-25页
     ·特征搜索第25-26页
     ·特征排序第26-27页
   ·索引技术第27-31页
     ·R 树第28-29页
     ·SS 树第29-30页
     ·VP 树第30页
     ·Grid 文件第30-31页
   ·样本裁减第31-33页
     ·最近邻编辑第31-32页
     ·样本学习法第32页
     ·样本修正法第32-33页
第四章 基于边界可信度相似的快速文本分类方法第33-44页
   ·中心向量法和KNN 法的文本分类方法及特性第33-35页
     ·中心向量法文本分类及其特性第33-34页
     ·KNN 法文本分类及其特性第34-35页
   ·基于边界可信度相似的快速文本分类思想第35-36页
   ·基于边界可信度相似的快速文本分类方法第36-38页
     ·边界距离定义及计算第36页
     ·基于边界可信度的相似性度量第36-37页
     ·基于边界可信度相似的快速文本分类算法第37-38页
   ·实验设计与分析第38-42页
   ·本章小结第42-44页
第五章 基于类别分布特征的快速文本分类方法第44-51页
   ·类别分布特征对文本分类的影响第44-45页
   ·平衡类别分布的策略第45页
   ·基于类别分布特征的文本分类思想第45-46页
   ·基于类别分布特征的文本分类方法第46-47页
     ·自适应相似性度量第46页
     ·基于类别分布特征的快速文本分类算法第46-47页
   ·实验设计与分析第47-50页
   ·本章小结第50-51页
第六章 总结与展望第51-52页
   ·总结第51页
   ·进一步研究及展望第51-52页
致谢第52-53页
参考文献第53-56页
附录:作者在攻读硕士学位期间发表的论文第56页

论文共56页,点击 下载论文
上一篇:基于软计算的基因调控网络应用研究
下一篇:三维曲面恢复