基于支持向量机的中文文本分类的系统研究
摘要 | 第1-5页 |
Abstract | 第5-7页 |
目录 | 第7-10页 |
第1章 绪论 | 第10-16页 |
·论文研究的背景和意义 | 第10-11页 |
·国内外研究现状 | 第11-14页 |
·文本分类研究现状 | 第11-12页 |
·支持向量机研究现状 | 第12-14页 |
·本文研究内容与组织结构 | 第14-16页 |
·研究内容 | 第14页 |
·组织结构 | 第14-16页 |
第2章 中文文本分类的相关技术 | 第16-30页 |
·文本分类的形式化描述 | 第16页 |
·中文分词 | 第16-17页 |
·特征选择 | 第17-20页 |
·权重计算 | 第20-22页 |
·文本分类方法 | 第22-24页 |
·贝叶斯方法 | 第22页 |
·KNN方法 | 第22-23页 |
·类中心向量方法 | 第23页 |
·最大熵模型 | 第23-24页 |
·支持向量机 | 第24页 |
·结果评价 | 第24-26页 |
·实验与分析 | 第26-29页 |
·实验数据集 | 第26-27页 |
·实验 | 第27页 |
·分析 | 第27-29页 |
·本章小结 | 第29-30页 |
第3章 支持向量机理论 | 第30-43页 |
·机器学习的基本方法 | 第30-33页 |
·学习问题的一般表示 | 第30-31页 |
·经验风险最小化原则 | 第31-32页 |
·模型复杂度与推广能力 | 第32-33页 |
·统计学习理论的基本思想 | 第33-35页 |
·VC维 | 第33-34页 |
·泛化误差的边界 | 第34页 |
·结构风险最小化原理 | 第34-35页 |
·支持向量机 | 第35-39页 |
·线性可分问题 | 第36-37页 |
·近似线性可分问题 | 第37-38页 |
·非线性可分问题 | 第38-39页 |
·算法实现 | 第39-40页 |
·选块算法(Chunking) | 第39页 |
·分解算法(Decomposing) | 第39-40页 |
·序贯最小优化算法(SMO) | 第40页 |
·实验与分析 | 第40-42页 |
·本章小结 | 第42-43页 |
第4章 基于GA-SVM算法的文本分类 | 第43-58页 |
·遗传算法 | 第43-50页 |
·基本遗传算法的思想 | 第43-44页 |
·基本遗传算法的结构 | 第44-45页 |
·遗传算法的实现 | 第45-49页 |
·遗传算法的特点 | 第49-50页 |
·基于GA-SVM算法的文本分类 | 第50-57页 |
·支持向量机参数的选择 | 第50-51页 |
·进化支持向量机算法GA-SVM | 第51-56页 |
·实验 | 第56-57页 |
·本章小结 | 第57-58页 |
第5章 文本分类系统的设计与实现 | 第58-62页 |
·系统模型 | 第58页 |
·系统实现 | 第58-60页 |
·特征向量的选取 | 第58-59页 |
·文档的表示 | 第59-60页 |
·分类器的模型表示 | 第60页 |
·开发环境 | 第60页 |
·系统功能与界面 | 第60-61页 |
·本章小结 | 第61-62页 |
第6章 总结与展望 | 第62-64页 |
·总结 | 第62页 |
·展望 | 第62-64页 |
参考文献 | 第64-67页 |
致谢 | 第67-68页 |
附录:攻读硕士学位期间发表的论文 | 第68页 |