基于Spark的文本分类技术的研究与实现
| 摘要 | 第4-5页 |
| Abstract | 第5页 |
| 1 绪论 | 第8-12页 |
| 1.1 研究背景 | 第8页 |
| 1.2 国内外研究概况 | 第8-10页 |
| 1.3 主要研究工作 | 第10-11页 |
| 1.4 论文组织结构 | 第11-12页 |
| 2 文本分类技术综述 | 第12-23页 |
| 2.1 文本表示方法 | 第12-14页 |
| 2.2 文本预处理 | 第14-15页 |
| 2.3 文本特征降维 | 第15-19页 |
| 2.4 文本分类算法 | 第19-22页 |
| 2.5 本章小结 | 第22-23页 |
| 3 中文文本分类系统设计 | 第23-44页 |
| 3.1 体系架构设计 | 第23-27页 |
| 3.2 系统功能模块设计 | 第27-43页 |
| 3.3 本章小结 | 第43-44页 |
| 4 中文文本分类系统实现 | 第44-56页 |
| 4.1 初始化语料库模块的实现 | 第44-47页 |
| 4.2 文本建模模块的实现 | 第47-52页 |
| 4.3 基于SVM的分类器模块实现 | 第52-55页 |
| 4.4 本章小结 | 第55-56页 |
| 5 实验设计与评估 | 第56-66页 |
| 5.1 实验环境 | 第56页 |
| 5.2 实验方案设计 | 第56-57页 |
| 5.3 实验评估标准 | 第57-58页 |
| 5.4 语料数据准备 | 第58-59页 |
| 5.5 实验结果及分析 | 第59-65页 |
| 5.6 本章小结 | 第65-66页 |
| 6 总结与展望 | 第66-68页 |
| 6.1 全文总结 | 第66页 |
| 6.2 课题展望 | 第66-68页 |
| 致谢 | 第68-69页 |
| 参考文献 | 第69-72页 |