中文文档分类技术研究
| 摘要 | 第1-5页 |
| Abstract | 第5-8页 |
| 第一章 引言 | 第8-16页 |
| ·课题背景及意义 | 第8-9页 |
| ·文档自动分类算法研究的现状和趋势 | 第9-15页 |
| ·文本自动分类研究的发展 | 第9-10页 |
| ·中文文本分类研究的技术现状 | 第10-15页 |
| ·K-近邻法(KNN算法) | 第11页 |
| ·Na(?)ve Bayes算法 | 第11-13页 |
| ·神经网络方法 | 第13-14页 |
| ·支持向量机方法 | 第14-15页 |
| ·本文的主要工作内容 | 第15-16页 |
| 第二章 分类算法基本模型 | 第16-22页 |
| ·Web的数据模型 | 第16-17页 |
| ·文本向量空间模型VSM | 第17-21页 |
| ·分类器模型 | 第21-22页 |
| 第三章 文本的特征获取 | 第22-42页 |
| ·中文分词的实现 | 第22-24页 |
| ·基于《知网》的词汇语义相似度计算 | 第24-36页 |
| ·词语相似度的含义 | 第25-27页 |
| ·《知网(Hownet)》简介 | 第27-31页 |
| ·基于《知网》的语义相似度计算方法 | 第31-36页 |
| ·文本分类中的特性抽取 | 第36-38页 |
| ·最优文本特征集形成 | 第38-42页 |
| 第四章 SVM研究和基于DSM的自学习算法 | 第42-61页 |
| ·基于统计学习理论的支持向量机算法研究 | 第42-54页 |
| ·理论背景 | 第42-44页 |
| ·过学习问题和SRM | 第44-46页 |
| ·方法介绍 | 第46-51页 |
| ·SVM算法在中文文档分类器中的实际应用 | 第51-53页 |
| ·支持向量机在分类算法中应用改良的思路 | 第53-54页 |
| ·差异相似矩阵算法 | 第54-61页 |
| ·差异相似矩阵(DSM)的定义及方法简介 | 第55-58页 |
| ·DSM算法在文本分类特征学习中的应用 | 第58-61页 |
| 第五章 文档分类评价算法 | 第61-65页 |
| ·影响文本分类系统评价的因素 | 第61-62页 |
| ·评价方法 | 第62-65页 |
| 第六章 文档分类系统的设计和实现 | 第65-76页 |
| ·中文文档分类系统的结构设计 | 第65-67页 |
| ·系统的实现 | 第67-72页 |
| ·实验结果 | 第72-76页 |
| 第七章 总结和展望 | 第76-78页 |
| ·总结 | 第76页 |
| ·展望 | 第76-78页 |
| 参考文献 | 第78-81页 |
| 附录1 | 第81-83页 |
| 附录2 | 第83-85页 |
| 附录3 | 第85-86页 |
| 致谢 | 第86页 |