首页--文化、科学、教育、体育论文--信息与知识传播论文--图书馆学、图书馆事业论文--图书馆学论文--图书馆自动化、网络化论文--电子图书馆、数字图书馆论文

数字图书馆中基于统计的自动文本分类方法研究

第一章 绪论第1-12页
   ·研究背景和意义第7-8页
   ·自动文本分类研究现状第8-10页
   ·自动文本分类评价方法第10-11页
   ·本文研究内容第11-12页
第二章 中文文本多层次特征表示方法第12-23页
   ·文本的形式化表示第12-14页
     ·向量空间模型第12页
     ·样本相似性度量第12-14页
   ·文本特征选择、提取和赋权第14-19页
     ·文本特征项第14页
     ·特征项选择第14-17页
     ·特征项提取第17页
     ·特征项赋权第17-19页
   ·中文文本多层次特征表示方法第19-22页
     ·实验一第19-21页
     ·实验二第21-22页
   ·本章小结第22-23页
第三章 基于核的距离加权KNN分类方法第23-35页
   ·典型的文本分类方法第23-29页
     ·有监督的分类方法第23-25页
     ·无监督的聚类方法第25-28页
     ·支持向量机第28-29页
   ·基于核的距离加权KNN文本分类器第29-33页
     ·实验一第31页
     ·实验二第31-33页
   ·本章小结第33-35页
第四章 自动文本分类中的样本分析技术第35-45页
   ·快速冗余文档检测第35-39页
     ·快速冗余文档检测算法第36-38页
     ·多层次特征下冗余文档检测第38-39页
   ·训练文本的重要性分析第39-43页
   ·本章小结第43-45页
第五章 基于学科主题词表的文本分类第45-53页
   ·提取学科主题词表第45-48页
   ·基于学科主题词表的文本分类第48-52页
   ·本章小结第52-53页
第六章 结论和展望第53-54页
   ·论文工作总结第53页
   ·未来的工作第53-54页
参考文献第54-57页
致谢第57-58页
作者简介第58页

论文共58页,点击 下载论文
上一篇:测井储层产能预测方法研究
下一篇:企业竞争力:“职能外包”战略的研究