首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

中文文本分类研究

摘要第1-12页
ABSTRACT第12-14页
第1章 前言第14-18页
   ·背景介绍第14-15页
   ·国内外文本自动分类研究动态第15-16页
   ·本文的工作第16-17页
   ·本文的组织和内容概要第17-18页
第2章 文本自动分类技术概述第18-49页
   ·文本自动分类的定义第18-21页
   ·文本预处理第21-25页
   ·文本模型第25-32页
     ·向量空间模型的基本概念第25-27页
     ·特征项的选择第27-29页
     ·关键词权重的计算第29-32页
     ·有关VSM的讨论第32页
   ·特征选取第32-37页
     ·文档频率(DF)第34页
     ·信息增益(IG)第34页
     ·互信息(MI)第34-35页
     ·X~2统计(CHI)第35-36页
     ·期望交叉熵(CE)第36页
     ·文本证据权第36页
     ·几率比第36-37页
     ·特征选取方法的比较第37页
   ·分类模型第37-45页
     ·Rocchio模型第37-38页
     ·NB(Naive Bayes)模型第38-39页
     ·KNN分类模型第39-40页
     ·基于组合核函数的SVM分类模型第40-43页
     ·其他的分类模型第43-45页
   ·实验结果及分析第45-48页
     ·数据集介绍第45页
     ·评价标准第45-46页
     ·实验结果第46-48页
   ·本章小结第48-49页
第3章 利用Web网页的内容和结构信息进行层次分类研究第49-57页
   ·引言第49-50页
   ·特征选择理论第50-51页
     ·HSFS(Hypertext Structure Feature Selection)第50-51页
     ·传统的特征选择第51页
   ·基于层次结构的分类器模型第51-53页
   ·实验设计与结果分析第53-56页
     ·实验材料及设计第53页
     ·学习算法第53-54页
     ·实验结果第54-56页
   ·本章小结第56-57页
第4章 基于Naive Bayes理论的多分类器组合研究第57-64页
   ·引言第57页
   ·多分类器组合问题第57-59页
   ·超文本分类理论基础第59-60页
     ·单分类器分类第59-60页
     ·综合分类器分类第60页
   ·Web页面分类实验第60-63页
     ·特征选择第61页
     ·实验结果分析第61-63页
   ·本章小结第63-64页
第5章 总结与展望第64-66页
参考文献第66-71页
致谢第71-72页
攻读学位期间发表的学术论文目录第72-73页
学位论文评阅及答辩情况表第73页

论文共59页,点击 下载论文
上一篇:唐代赠序文研究
下一篇:宝钢2050热轧卷取机计算机系统的改造