中文文档分类技术研究

摘要	第1-5页
Abstract	第5-8页
第一章引言	第8-16页
·课题背景及意义	第8-9页
·文档自动分类算法研究的现状和趋势	第9-15页
·文本自动分类研究的发展	第9-10页
·中文文本分类研究的技术现状	第10-15页
·K-近邻法(KNN算法)	第11页
·Na(?)ve Bayes算法	第11-13页
·神经网络方法	第13-14页
·支持向量机方法	第14-15页
·本文的主要工作内容	第15-16页
第二章分类算法基本模型	第16-22页
·Web的数据模型	第16-17页
·文本向量空间模型VSM	第17-21页
·分类器模型	第21-22页
第三章文本的特征获取	第22-42页
·中文分词的实现	第22-24页
·基于《知网》的词汇语义相似度计算	第24-36页
·词语相似度的含义	第25-27页
·《知网(Hownet)》简介	第27-31页
·基于《知网》的语义相似度计算方法	第31-36页
·文本分类中的特性抽取	第36-38页
·最优文本特征集形成	第38-42页
第四章 SVM研究和基于DSM的自学习算法	第42-61页
·基于统计学习理论的支持向量机算法研究	第42-54页
·理论背景	第42-44页
·过学习问题和SRM	第44-46页
·方法介绍	第46-51页
·SVM算法在中文文档分类器中的实际应用	第51-53页
·支持向量机在分类算法中应用改良的思路	第53-54页
·差异相似矩阵算法	第54-61页
·差异相似矩阵(DSM)的定义及方法简介	第55-58页
·DSM算法在文本分类特征学习中的应用	第58-61页
第五章文档分类评价算法	第61-65页
·影响文本分类系统评价的因素	第61-62页
·评价方法	第62-65页
第六章文档分类系统的设计和实现	第65-76页
·中文文档分类系统的结构设计	第65-67页
·系统的实现	第67-72页
·实验结果	第72-76页
第七章总结和展望	第76-78页
·总结	第76页
·展望	第76-78页
参考文献	第78-81页
附录1	第81-83页
附录2	第83-85页
附录3	第85-86页
致谢	第86页