中文文档分类技术研究
摘要 | 第1-5页 |
Abstract | 第5-8页 |
第一章 引言 | 第8-16页 |
·课题背景及意义 | 第8-9页 |
·文档自动分类算法研究的现状和趋势 | 第9-15页 |
·文本自动分类研究的发展 | 第9-10页 |
·中文文本分类研究的技术现状 | 第10-15页 |
·K-近邻法(KNN算法) | 第11页 |
·Na(?)ve Bayes算法 | 第11-13页 |
·神经网络方法 | 第13-14页 |
·支持向量机方法 | 第14-15页 |
·本文的主要工作内容 | 第15-16页 |
第二章 分类算法基本模型 | 第16-22页 |
·Web的数据模型 | 第16-17页 |
·文本向量空间模型VSM | 第17-21页 |
·分类器模型 | 第21-22页 |
第三章 文本的特征获取 | 第22-42页 |
·中文分词的实现 | 第22-24页 |
·基于《知网》的词汇语义相似度计算 | 第24-36页 |
·词语相似度的含义 | 第25-27页 |
·《知网(Hownet)》简介 | 第27-31页 |
·基于《知网》的语义相似度计算方法 | 第31-36页 |
·文本分类中的特性抽取 | 第36-38页 |
·最优文本特征集形成 | 第38-42页 |
第四章 SVM研究和基于DSM的自学习算法 | 第42-61页 |
·基于统计学习理论的支持向量机算法研究 | 第42-54页 |
·理论背景 | 第42-44页 |
·过学习问题和SRM | 第44-46页 |
·方法介绍 | 第46-51页 |
·SVM算法在中文文档分类器中的实际应用 | 第51-53页 |
·支持向量机在分类算法中应用改良的思路 | 第53-54页 |
·差异相似矩阵算法 | 第54-61页 |
·差异相似矩阵(DSM)的定义及方法简介 | 第55-58页 |
·DSM算法在文本分类特征学习中的应用 | 第58-61页 |
第五章 文档分类评价算法 | 第61-65页 |
·影响文本分类系统评价的因素 | 第61-62页 |
·评价方法 | 第62-65页 |
第六章 文档分类系统的设计和实现 | 第65-76页 |
·中文文档分类系统的结构设计 | 第65-67页 |
·系统的实现 | 第67-72页 |
·实验结果 | 第72-76页 |
第七章 总结和展望 | 第76-78页 |
·总结 | 第76页 |
·展望 | 第76-78页 |
参考文献 | 第78-81页 |
附录1 | 第81-83页 |
附录2 | 第83-85页 |
附录3 | 第85-86页 |
致谢 | 第86页 |