首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--在其他方面的应用论文

数字图书馆中词频提取和自动文本分类方法的研究

中文摘要第1-3页
英文摘要第3-4页
目录第4-17页
第一章 引言第17-26页
 1.1 数字图书馆的概念第17-18页
 1.2 为什么需要数字图书馆第18-19页
 1.3 数字图书馆的问题领域和国内外的研究现状第19-24页
 1.4 本文所做的工作和主要贡献第24-25页
 1.5 各章内容安排第25-26页
第二章 预备知识第26-34页
 2.1 机群并行计算机系统第26-28页
 2.2 数字图书馆中并行文本处理系统的体系结构第28-34页
第三章 文本的词频提取第34-51页
 3.1 词频提取策略与散列方法第34-39页
  3.1.1 散列方法的选择第34-37页
  3.1.2 散列表模板第37-39页
 3.2 词频文件生成算法第39-47页
  3.2.1 全局词频提取算法第41-45页
  3.2.2 部分词频提取算法第45-47页
 3.3 词频提取算法实验结果和性能分析第47-51页
  3.3.1 性能分析第47-48页
  3.3.2 词频提取算法的实验结果第48-51页
第四章 文本的自动分类第51-79页
 4.1 自动文本分类概述第51-52页
 4.2 基于朴素贝叶斯理论的分类方法第52-73页
  4.2.1 贝叶斯原理第52-54页
  4.2.2 文本特征提取第54-60页
  4.2.3 学习阶段第60-68页
  4.2.4 分类阶段第68-72页
  4.2.5 实验结果和性能分析第72-73页
 4.3 基于向量空间模型的文本分类第73-79页
  4.3.1 经典方法第73-74页
  4.3.2 改进的权重计算方法第74-75页
  4.3.3 学习阶段第75-76页
  4.3.4 分类阶段第76-77页
  4.3.5 实验结果和性能分析第77-79页
第五章 分类器的维护第79-84页
 5.1 添加类算法第79-81页
 5.2 删除类算法第81-84页
结论和未来工作第84-86页
攻读硕士期间所发表的论文第86-87页
致谢第87-88页
参考文献第88-92页

论文共92页,点击 下载论文
上一篇:龟山滑坡体稳定分析及开挖方案优化
下一篇:论我国九十年代大众传媒发展的总体特征