首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于向量空间模型的文本分类算法研究

摘要第1-6页
ABSTRACT第6-11页
第一章 绪论第11-16页
   ·研究目的和意义第11-12页
   ·国内外研究现状第12-15页
   ·论文结构安排第15-16页
第二章 VSM文本分类的数学模型第16-24页
   ·文本数据预处理第16-18页
     ·文本分词第16-17页
     ·特征提取第17-18页
     ·消除停用词第18页
   ·VSM模型建立第18-21页
     ·向量空间模型简介第18-19页
     ·词条权重的计算第19-20页
     ·相似度的测量第20-21页
   ·文本分类的方法第21-23页
     ·分割式分类算法(Partitioning Methods)第21-22页
     ·阶层式分类算法(Hierarchical Methods)第22页
     ·基于模型的分类算法(Model-Based Methods)第22-23页
   ·本章小结第23-24页
第三章 语义本体库在文本分类中的应用第24-33页
   ·概念词典的建立第24-26页
     ·HowNet简介第24-25页
     ·义原层次结构第25-26页
   ·词语义项的表征方法及其可计算性第26-28页
     ·基于义原的表征方法及其可计算性第26-27页
     ·基于概念依存关系的表征方法及其可计算性第27-28页
     ·二维结构表征方法及其可计算性第28页
   ·语义相似性计算第28-32页
     ·词语相似度第28-30页
     ·语句相似度第30-31页
     ·文本相似度第31-32页
   ·本章小结第32-33页
第四章 基于语义扩展的VSM分类算法第33-51页
   ·建立原始向量空间模型第33-37页
     ·文本预处理第33-34页
     ·TF-IDF权重计算第34-36页
     ·原始向量空间模型建立第36-37页
   ·基于概念进行向量空间降维第37-41页
     ·引入概念降维必要性分析第37-38页
     ·概念同义词辨识第38-40页
     ·基于同义词集合语义降维第40-41页
   ·VSM向量空间语义扩展第41-48页
     ·语义层次树分析第42页
     ·VSM语义建立扩展向量第42-43页
     ·扩展文本相似度算法第43-45页
     ·文本举例第45-48页
   ·文本分类第48-50页
     ·分类策略第48-49页
     ·分类指标第49-50页
   ·本章小结第50-51页
第五章 实验过程与结果分析第51-61页
   ·实验环境第51-52页
     ·实验平台第51页
     ·实验语料第51-52页
     ·分词系统第52页
   ·评估指标第52-53页
   ·实验过程第53-54页
     ·训练过程第53页
     ·分类过程第53-54页
   ·实验结果分析第54-60页
     ·小型文本分类第54-55页
     ·改进的VSM算法与传统算法分类精度对比第55-57页
     ·改进的VSM算法对向量空间维数的影响第57-60页
   ·本章小结第60-61页
结论第61-63页
致谢第63-64页
参考文献第64-68页
附录第68-69页
详细摘要第69-72页

论文共72页,点击 下载论文
上一篇:头部缺失的JPEG文件恢复方法研究
下一篇:基于Nutch的科技项目主题搜索引擎研究