中文文本分类研究

摘要	第1-12页
ABSTRACT	第12-14页
第1章前言	第14-18页
·背景介绍	第14-15页
·国内外文本自动分类研究动态	第15-16页
·本文的工作	第16-17页
·本文的组织和内容概要	第17-18页
第2章文本自动分类技术概述	第18-49页
·文本自动分类的定义	第18-21页
·文本预处理	第21-25页
·文本模型	第25-32页
·向量空间模型的基本概念	第25-27页
·特征项的选择	第27-29页
·关键词权重的计算	第29-32页
·有关VSM的讨论	第32页
·特征选取	第32-37页
·文档频率(DF)	第34页
·信息增益(IG)	第34页
·互信息(MI)	第34-35页
·X~2统计(CHI)	第35-36页
·期望交叉熵(CE)	第36页
·文本证据权	第36页
·几率比	第36-37页
·特征选取方法的比较	第37页
·分类模型	第37-45页
·Rocchio模型	第37-38页
·NB(Naive Bayes)模型	第38-39页
·KNN分类模型	第39-40页
·基于组合核函数的SVM分类模型	第40-43页
·其他的分类模型	第43-45页
·实验结果及分析	第45-48页
·数据集介绍	第45页
·评价标准	第45-46页
·实验结果	第46-48页
·本章小结	第48-49页
第3章利用Web网页的内容和结构信息进行层次分类研究	第49-57页
·引言	第49-50页
·特征选择理论	第50-51页
·HSFS(Hypertext Structure Feature Selection)	第50-51页
·传统的特征选择	第51页
·基于层次结构的分类器模型	第51-53页
·实验设计与结果分析	第53-56页
·实验材料及设计	第53页
·学习算法	第53-54页
·实验结果	第54-56页
·本章小结	第56-57页
第4章基于Naive Bayes理论的多分类器组合研究	第57-64页
·引言	第57页
·多分类器组合问题	第57-59页
·超文本分类理论基础	第59-60页
·单分类器分类	第59-60页
·综合分类器分类	第60页
·Web页面分类实验	第60-63页
·特征选择	第61页
·实验结果分析	第61-63页
·本章小结	第63-64页
第5章总结与展望	第64-66页
参考文献	第66-71页
致谢	第71-72页
攻读学位期间发表的学术论文目录	第72-73页
学位论文评阅及答辩情况表	第73页