企业经营范围字段自动分类方法研究
摘要 | 第1-5页 |
Abstract | 第5-9页 |
第1章 绪论 | 第9-15页 |
·研究的背景和意义 | 第9-10页 |
·相关研究综述 | 第10-14页 |
·中文分词综述 | 第10-11页 |
·文本分类综述 | 第11-14页 |
·主要研究内容和组织结构 | 第14-15页 |
第2章 文本分类方法研究 | 第15-34页 |
·文本分类方法研究 | 第15-19页 |
·文本分类的一般过程和文本的表达 | 第15-17页 |
·基于统计的文本分类方法 | 第17-19页 |
·SVM 算法研究 | 第19-26页 |
·SVM 算法概述 | 第19页 |
·SVM 算法原理 | 第19-24页 |
·SVM 分类器的构造 | 第24-26页 |
·朴素贝叶斯分类算法研究 | 第26-28页 |
·Boosting 算法研究 | 第28-33页 |
·AdaBoost 算法简介 | 第29-30页 |
·Boosting 算法理论 | 第30-33页 |
·本章小结 | 第33-34页 |
第3章 短文本分词方法研究 | 第34-50页 |
·中文分词方法概述 | 第34-38页 |
·中文分词方法的应用、意义 | 第34-35页 |
·中文分词技术的发展现状 | 第35-36页 |
·中文分词的难点和解决方案 | 第36-38页 |
·中文分词方法研究 | 第38-42页 |
·基于规则的中文分词算法 | 第38-40页 |
·基于统计的中文分词算法 | 第40-42页 |
·自主学习分词算法的研究 | 第42-49页 |
·企业经营范围文法研究 | 第43-46页 |
·自主学习分词算法的设计及实现 | 第46-49页 |
·本章小结 | 第49-50页 |
第4章 基于统计的企业经营范围分类 | 第50-61页 |
·分类方法研究概述 | 第50-51页 |
·实现原理 | 第50页 |
·实现方案 | 第50-51页 |
·基于SVM 的数据校正方法 | 第51-54页 |
·数据校正的必要性 | 第51页 |
·逐步求精的数据校正策略 | 第51-54页 |
·基于朴素贝叶斯的Boosting 分类算法设计 | 第54-60页 |
·特征项的选择和表示 | 第54-56页 |
·分类算法设计 | 第56-60页 |
·本章小结 | 第60-61页 |
第5章 系统设计与测试 | 第61-65页 |
·系统设计 | 第61-63页 |
·系统架构 | 第61页 |
·逐步求精的数据校正子系统 | 第61-62页 |
·基于朴素贝叶斯的Boosting 分类子系统 | 第62-63页 |
·实验结果与分析 | 第63-65页 |
·实验数据和设置 | 第63页 |
·实验结果和分析 | 第63-65页 |
结论 | 第65-67页 |
参考文献 | 第67-71页 |
致谢 | 第71页 |