摘要 | 第5-6页 |
ABSTRACT | 第6-7页 |
第一章 绪论 | 第10-15页 |
1.1 选题背景和意义 | 第10-11页 |
1.2 国内外研究现状 | 第11-13页 |
1.3 本文所做的工作和组织结构 | 第13-15页 |
第二章 文本分类相关技术介绍 | 第15-30页 |
2.1 文本分类前的处理 | 第15-20页 |
2.1.1 文本预处理 | 第15-16页 |
2.1.2 文本结构化表示 | 第16-17页 |
2.1.3 特征权重计算 | 第17-18页 |
2.1.4 文本降维 | 第18-20页 |
2.2 常见的文本分类算法 | 第20-27页 |
2.2.1 k近邻算法 | 第21-22页 |
2.2.2 朴素贝叶斯算法 | 第22-23页 |
2.2.3 决策树 | 第23-27页 |
2.3 文本分类性能评价指标 | 第27-29页 |
2.4 本章小结 | 第29-30页 |
第三章 随机森林介绍及改进 | 第30-50页 |
3.1 BAGGING算法介绍 | 第30-34页 |
3.2 随机子空间方法介绍 | 第34-36页 |
3.3 随机森林算法介绍 | 第36-38页 |
3.4 传统随机森林算法的不足之处及改进措施 | 第38-46页 |
3.5 本文提出的随机森林的改进算法介绍 | 第46-49页 |
3.6 本章小结 | 第49-50页 |
第四章 实验设计与结果分析 | 第50-83页 |
4.1 实验概要介绍 | 第50页 |
4.2 实验使用的语料库来源说明 | 第50-52页 |
4.3 实验环境 | 第52页 |
4.3.1 主要硬件配置 | 第52页 |
4.3.2 程序运行环境 | 第52页 |
4.4 各随机森林算法之间的对比实验 | 第52-75页 |
4.4.1 实验设计 | 第52-53页 |
4.4.2 平局现象比较结果与分析 | 第53-60页 |
4.4.3 文本分类性能比较结果与分析 | 第60-68页 |
4.4.4 耗时比较结果与分析 | 第68-74页 |
4.4.5 各随机森林算法之间的对比实验小结 | 第74-75页 |
4.5 WDS-RF算法与其它常用的分类算法的对比实验 | 第75-81页 |
4.5.1 实验设计 | 第75-76页 |
4.5.2 文本分类性能比较结果与分析 | 第76-80页 |
4.5.3 耗时比较结果与分析 | 第80-81页 |
4.5.4 WDS-RF算法与其它常用的分类算法的对比实验小结 | 第81页 |
4.6 本章小结 | 第81-83页 |
第五章 总结与展望 | 第83-86页 |
5.1 总结 | 第83-84页 |
5.2 下一步工作展望 | 第84-86页 |
参考文献 | 第86-90页 |
攻读硕士学位期间取得的研究成果 | 第90-91页 |
致谢 | 第91-92页 |
附件 | 第92页 |