首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

一种基于关键向量的文本分类模型的研究

摘要第1-6页
Abstract第6-9页
第1章 绪论第9-15页
   ·论文研究的的背景及意义第9-10页
   ·国内外研究现状第10-12页
   ·本文研究内容及论文组织结构第12-15页
第2章 向量空间模型第15-24页
   ·文本表示第15-18页
     ·特征项抽取作为文本特征第15-17页
     ·特征项权重计算 TF-IDF 公式第17-18页
     ·相似度计算第18页
   ·向量空间模型第18-19页
     ·向量空间模型的基本概念第18-19页
     ·向空间模型的特点第19页
   ·常用的文本分类算法第19-23页
   ·本章小结第23-24页
第3章 基于关键向量的文本分类算法第24-32页
   ·基本思路介绍第24-28页
     ·传统的基于向量空间模型算法的不足第24-25页
     ·早期的改进思路第25-27页
     ·算法的评价第27-28页
   ·基于关键向量的文本分类算法介绍第28-30页
     ·相关概念的引入第28页
     ·新算法的工作原理第28-30页
   ·相关阈值的确定第30-31页
     ·K 值的确定第30-31页
     ·k_1 和k_2 值的确定第31页
   ·本章小结第31-32页
第4章 系统实现第32-41页
   ·实验设计第32页
   ·系统模型第32-34页
   ·系统实现第34-37页
     ·文本收集第34页
     ·预处理第34-35页
     ·文档的向量化第35-36页
     ·关键向量的计算第36-37页
     ·测试第37页
   ·主要算法描述第37-40页
     ·词频统计模块第37-38页
     ·关键向量查找模块第38-39页
     ·文本分类模块第39-40页
   ·本章小结第40-41页
第5章 测试第41-53页
   ·测试语料库第41-45页
     ·文件格式第41页
     ·文件内部标签第41-43页
     ·类别第43-45页
   ·实验环境说明第45-46页
   ·评价标准第46页
   ·实验过程及结果第46-51页
     ·实验一:K 值的选取对分类效果的影响第46-47页
     ·实验二:分类文件数量对分类效果的影响第47-49页
     ·实验三:与其它分类算法的比较第49-50页
     ·算法的时间性能分析第50-51页
   ·实验讨论第51-52页
   ·本章小结第52-53页
结论第53-54页
附录:分类器实现的主要代码第54-62页
参考文献第62-66页
攻读硕士学位期间发表的学术论文第66-67页
致谢第67页

论文共67页,点击 下载论文
上一篇:基于点模型的曲面重建技术的研究
下一篇:竖向荷载作用下半刚性连接钢框架的简化分析